Kurzbeschreibung:
In der Lexikographie werden bilinguale Korpora immer häufiger für die
Wörterbucherstellung genutzt. Dazu werden die Texte automatisch
aligniert: Algorithmen stellen Übereinstimmungen
zwischen z.B. englischem Text und seiner deutschen Übersetzung auf
Satz- und Wortebene her.
Die so entstandenen Übersetzungspaare werden dann extrahiert und für
die Wörterbucherstellung ausgewertet.
Es gibt, ausgehend von maschineller Übersetzung, verschiedene Ansätze, parallele Texte zu alignieren. Diese Ansätze gibt es sowohl für die Satz- als auch für die Wortebene. Die meisten Ansätze haben jedoch gemein, dass sie auf statistische Verfahren aufbauen und linguistische Informationen und Verfahren nur begrenzt bis gar nicht einsetzen. In dieser Diplomarbeit soll untersucht werden, wie bestehende, frei verfügbare Alignment-Programme durch gezielte, linguistisch motivierte Erweiterungen verbessert werden können.
Voraussetzungen:
Dauer:
Betreuer: