Projekt TT in MT

Baumübersetzer in der maschinellen Übersetzung

Baumübersetzer in der maschinellen Übersetzung

Laufzeit
Februar 2011 - Januar 2017
PI
Andreas Maletti
Kurzbeschreibung

In diesem Projekt sollen einerseits ein zufriedenstellendes Übersetzungsmodell für syntax-basierte Übersetzer und die grundlegenden Algorithmen für dessen Verwendung entwickelt werden. Dieses Modell soll auch in einem frei verfügbaren und wettbewerbsfähigen Toolkit implementiert werden. Andererseits soll die vorhandene Technologie für maschinelle Übersetzer an syntax-basierte Übersetzer angepasst werden. Dies erfordert die Entwicklung von syntax-basierten Qualitätsmetriken, Korrespondenzen (alignments) und Eigenschaften (features). Um die Anwendbarkeit unserer Resultate zu demonstrieren, soll weiterhin ein syntax-basiertes Übersetzungssystem auf Basis unseres Toolkits entwickelt werden.

Geldgeber
Deutsche Forschungsgemeinschaft (DFG)
Langbeschreibung

Seitdem syntax-basierte Übersetzungssysteme natürlicher Sprachen in der Praxis weite Anwendung finden, besteht ein großes Interesse an formalen Modellen für Baumsprachen und Baumtransformationen. Baumautomaten und Baumübersetzer sind endliche Modelle, die derartige (ungewichtete oder gewichtete) Baumsprachen bzw. Baumtransformationen berechnen. Es existieren viele Varianten dieser Modelle, allerdings ist kein bekanntes Modell für den Einsatz in einem Toolkit für syntax-basierte maschinelle Übersetzer geeignet. Dies liegt entweder an der unzureichenden Ausdrucksstärke oder dem Fehlen von essentiellen Eigenschaften (wie z.B. dem Abschluss unter Komposition oder der Erhaltung der Regularität). Damit unterscheidet sich die Situation wesentlich vom Bereich der wort- und phrasen-basierten Übersetzungssysteme, für die Toolkits, die auf endlichen Zeichenreihenübersetzern basieren, der de-facto Implementierungsstandard sind.

In diesem Projekt sollen einerseits ein zufriedenstellendes Übersetzungsmodell für syntax-basierte Übersetzer und die grundlegenden Algorithmen für dessen Verwendung entwickelt werden. Dieses Modell soll auch in einem frei verfügbaren und wettbewerbsfähigen Toolkit implementiert werden. Andererseits soll die vorhandene Technologie für maschinelle Übersetzer an syntax-basierte Übersetzer angepasst werden. Dies erfordert die Entwicklung von syntax-basierten Qualitätsmetriken, Korrespondenzen (alignments) und Eigenschaften (features). Um die Anwendbarkeit unserer Resultate zu demonstrieren, soll weiterhin ein syntax-basiertes Übersetzungssystem auf Basis unseres Toolkits entwickelt werden.

Team
  • Fabienne Braune
  • Aurélie Lagoutte (Sommerpraktikantin 2011)
  • Dr. Andreas Maletti
  • Daniel Quernheim
  • Nina Seemann
Publikationen
In Zeitschriften
Bei Konferenzen
 

Kontakt IMS

Pfaffenwaldring 5 b, 70569 Stuttgart

 

Webmaster des IMS

Zum Seitenanfang