• Nemecký jazyk

Fehlerquellen beim Part-of-speech-Tagging am Beispiel verschiedener Textarten

Autor: Jascha Daniló Jung

Studienarbeit aus dem Jahr 2017 im Fachbereich Germanistik - Linguistik, Note: 1,7, Technische Universit¿Darmstadt (Institut f¿r Sprach- und Literaturwissenschaft), Veranstaltung: Forschungsthemen der Korpus- und Computerlinguistik - computervermittelte... Viac o knihe

Na objednávku, dodanie 2-4 týždne

16.65 €

bežná cena: 18.50 €

O knihe

Studienarbeit aus dem Jahr 2017 im Fachbereich Germanistik - Linguistik, Note: 1,7, Technische Universit¿Darmstadt (Institut f¿r Sprach- und Literaturwissenschaft), Veranstaltung: Forschungsthemen der Korpus- und Computerlinguistik - computervermittelte Interaktion (DH), Sprache: Deutsch, Abstract: Automatische Tagger spielen eine wichtige Rolle bei der Bearbeitung gro¿r Textkorpora. Ohne sie w¿ es nicht m¿glich gro¿ Textmengen in kurzen Zeitr¿en mit bestimmten linguistischen Merkmalen zu annotieren und somit f¿r die weitere Bearbeitung zug¿lich zu machen. Viele dieser Tagger sind als Open-Source Software verf¿gbar.

Das Ziel dieser Arbeit ist es, einen Vergleich zwei solcher Tagger durchzuf¿hren, indem sie auf unterschiedliche deutsche Texte angewandt werden, die von der deutschen Standardvariet¿in kleinem bis gro¿m Umfang abweichen. Anschlie¿nd k¿nnen die Textstellen betrachtet werden, bei denen die Tagger unterschiedliche Annotationen erzeugen. Der Fokus liegt dabei auf der Frage, welche Probleme durch die Besonderheiten der deutschen Sprache und seiner Variet¿n bei den hier verwendeten Taggern beispielhaft auftreten und den daraus resultierenden falschen oder ambigen Annotationen.

Der Aufbau der Arbeit gliedert sich wie folgt: Zun¿st werden im Abschnitt 'Methodik' ¿ nach einem kurzen ¿erblick ¿ber den aktuellen Forschungsstand - die verwendeten Part-of-Speech-Tagger (PoS-Tagger) vorgestellt. Anschlie¿nd werden deutsche Texte f¿r den Test der Tagger ausgew¿t und vorgestellt. Diese Texte sollen sich in ihrer Abweichung von der deutschen
Standardvariet¿m¿glichst stark unterscheiden, um eine breite Fl¿e an m¿glichen "Stolpersteinen" f¿r die Tagger zu bieten. Anschlie¿nd erfolgt die Annotation der ausgew¿ten Texte mit den ausgew¿ten Taggern und schlie¿ich eine Auswertung der resultierenden annotierten Token. Zum Schluss werden die Ergebnisse noch einmal kurz zusammengefasst.

  • Vydavateľstvo: GRIN Verlag
  • Rok vydania: 2018
  • Formát: Paperback
  • Rozmer: 210 x 148 mm
  • Jazyk: Nemecký jazyk
  • ISBN: 9783668754072

Generuje redakčný systém BUXUS CMS spoločnosti ui42.