Baumübersetzer in der maschinellen Übersetzung
- Laufzeit
-
Februar 2011 - Januar 2017
- PI
-
Andreas Maletti
- Kurzbeschreibung
-
In diesem Projekt sollen einerseits ein zufriedenstellendes Übersetzungsmodell für syntax-basierte Übersetzer und die grundlegenden Algorithmen für dessen Verwendung entwickelt werden. Dieses Modell soll auch in einem frei verfügbaren und wettbewerbsfähigen Toolkit implementiert werden. Andererseits soll die vorhandene Technologie für maschinelle Übersetzer an syntax-basierte Übersetzer angepasst werden. Dies erfordert die Entwicklung von syntax-basierten Qualitätsmetriken, Korrespondenzen (alignments) und Eigenschaften (features). Um die Anwendbarkeit unserer Resultate zu demonstrieren, soll weiterhin ein syntax-basiertes Übersetzungssystem auf Basis unseres Toolkits entwickelt werden.
- Geldgeber
-
Deutsche Forschungsgemeinschaft (DFG)
- Langbeschreibung
-
Seitdem syntax-basierte Übersetzungssysteme natürlicher Sprachen in der Praxis weite Anwendung finden, besteht ein großes Interesse an formalen Modellen für Baumsprachen und Baumtransformationen. Baumautomaten und Baumübersetzer sind endliche Modelle, die derartige (ungewichtete oder gewichtete) Baumsprachen bzw. Baumtransformationen berechnen. Es existieren viele Varianten dieser Modelle, allerdings ist kein bekanntes Modell für den Einsatz in einem Toolkit für syntax-basierte maschinelle Übersetzer geeignet. Dies liegt entweder an der unzureichenden Ausdrucksstärke oder dem Fehlen von essentiellen Eigenschaften (wie z.B. dem Abschluss unter Komposition oder der Erhaltung der Regularität). Damit unterscheidet sich die Situation wesentlich vom Bereich der wort- und phrasen-basierten Übersetzungssysteme, für die Toolkits, die auf endlichen Zeichenreihenübersetzern basieren, der de-facto Implementierungsstandard sind.
In diesem Projekt sollen einerseits ein zufriedenstellendes Übersetzungsmodell für syntax-basierte Übersetzer und die grundlegenden Algorithmen für dessen Verwendung entwickelt werden. Dieses Modell soll auch in einem frei verfügbaren und wettbewerbsfähigen Toolkit implementiert werden. Andererseits soll die vorhandene Technologie für maschinelle Übersetzer an syntax-basierte Übersetzer angepasst werden. Dies erfordert die Entwicklung von syntax-basierten Qualitätsmetriken, Korrespondenzen (alignments) und Eigenschaften (features). Um die Anwendbarkeit unserer Resultate zu demonstrieren, soll weiterhin ein syntax-basiertes Übersetzungssystem auf Basis unseres Toolkits entwickelt werden.
- Team
-
- Fabienne Braune
- Aurélie Lagoutte (Sommerpraktikantin 2011)
- Dr. Andreas Maletti
- Daniel Quernheim
- Nina Seemann
- Publikationen
-
In Zeitschriften
- Artur Jeż und Andreas Maletti
Hyper-minimization for deterministic tree automata
Int. J. Found. Comput. Sci. , © World Scientific, 2013.
— [ bib ] - Andreas Maletti und Daniel Quernheim
Unweighted and weighted hyper-minimization
Int. J. Found. Comput. Sci., 23(6):1207-1225, © World Scientific, 2012.
— [ bib | http ] - Zoltán Ésik und Andreas Maletti
The category of simulations for weighted tree automata
Int. J. Found. Comput. Sci., 22(8):1845-1859, © World Scientific, 2011.
— [ bib | http ] - Andreas Maletti und Daniel Quernheim
Optimal hyper-minimization
Int. J. Found. Comput. Sci., 22(8):1877-1891, © World Scientific, 2011.
— [ bib | http | arXiv ] - Andreas Maletti
Part II: Application in machine translation of Survey: Weighted extended top-down tree transducers
Fundam. Inform., 112(2-3):239-261, 2011.
— [ bib | http ] - Andreas Maletti
Part I: Basics and expressive power of Survey: Weighted extended top-down tree transducers
Acta Cybernet., 20(2):223-250, 2011.
— [ bib | http ]
Bei Konferenzen
- Zoltán Fülöp und Andreas Maletti
Composition closure of ε-free linear extended top-down tree transducers
Proc. 17th Int. Conf. Developments in Language Theory
© Springer-Verlag, 2013.
— [ bib ] - Matthias Büchse, Andreas Maletti und Heiko Vogler
Unidirectional derivation semantics for synchronous tree-adjoining grammars
Proc. 16th Int. Conf. Developments in Language Theory
Band 7410 von LNCS, Seiten 368-379. © Springer-Verlag, 2012.
— [ bib | http | Folien ] - Andreas Maletti
Every sensible extended top-down tree transducer is a multi bottom-up tree transducer
Proc. 12th Conf. North American Chapter of the Association for Computational Linguistics
Seiten 263-273. © Association for Computational Linguistics, 2012.
— [ bib | http | Poster ] - Joost Engelfriet und Andreas Maletti
Strong lexicalization of tree adjoining grammars
Proc. 50th Annual Meeting Association for Computational Linguistics
Seiten 506-515. © Association for Computational Linguistics, 2012.
— [ bib | http | Folien ] - Fabienne Braune, Andreas Maletti, Daniel Quernheim und Nina Seemann
Preservation of recognizability for weighted linear extended top-down tree transducers
Proc. 2nd Workshop Applications of Tree Automata in Natural Language Processing
Seiten 1-10. © Association for Computational Linguistics, 2012.
— [ bib | http ] - Fabienne Braune, Aurélie Lagoutte, Andreas Maletti und Daniel Quernheim
Composing extended top-down tree transducers
Proc. 13th Int. Conf. European Chapter of the Association for Computational Linguistics
Seiten 808-817. © Association for Computational Linguistics, 2012.
— [ bib | http ] - Artur Jeż und Andreas Maletti
Hyper-minimization for deterministic tree automata
Proc. 17th Int. Conf. Implementation and Application of Automata
Band 7381 von LNCS, Seiten 217-228. © Springer-Verlag, 2012.
— [ bib | http | Folien ] - Aurélie Lagoutte und Andreas Maletti
Part III: Composition of Survey: Weighted extended top-down tree transducers (eingeladener Vortrag)
Proc. Workshop Algebraic Foundations in Computer Science
Band 7020 von LNCS, Seiten 272-308. © Springer-Verlag, 2011.
— [ bib | http | Folien ] - Andreas Maletti
Tree transformations and dependencies (eingeladener Vortrag)
Proc. 12th Meeting Mathematics of Language
Band 6878 von LNAI, Seiten 1-20. © Springer-Verlag, 2011.
— [ bib | http | Folien ] - Andreas Maletti und Daniel Quernheim
Pushing for weighted tree automata
Proc. 36th Int. Symp. Mathematical Foundations of Computer Science
Band 6907 von LNCS, Seiten 460-471. © Springer-Verlag, 2011.
— [ bib | http ] - Artur Jeż und Andreas Maletti
Computing all l-cover automata fast
Proc. 16th Int. Conf. Implementation and Application of Automata
Band 6807 von LNCS, Seiten 203-214. © Springer-Verlag, 2011.
— [ bib | http ] - Andreas Maletti
Notes on hyper-minimization (eingeladener Vortrag)
Proc. 13th Int. Conf. Automata and Formal Languages
Seiten 34-49. © Nyíregyháza College, 2011.
— [ bib | Folien ] - Andreas Maletti und Daniel Quernheim
Hyper-minimisation of deterministic weighted finite automata over semifields
Proc. 13th Int. Conf. Automata and Formal Languages
Seiten 285-299. © Nyíregyháza College, 2011.
— [ bib | Folien ] - Andreas Maletti
How to train your multi bottom-up tree transducer
Proc. 49th Annual Meeting Association for Computational Linguistics
Seiten 825-834. © Association for Computational Linguistics, 2011.
— [ bib | http | Folien ] - Paweł Gawrychowski, Artur Jeż und Andreas Maletti
On minimising automata with errors
Proc. 36th Int. Symp. Mathematical Foundations of Computer Science
Band 6907 von LNCS, Seiten 327-338. © Springer-Verlag, 2011.
— [ bib | http | arXiv ]
- Artur Jeż und Andreas Maletti
Kontakt IMS
Pfaffenwaldring 5 b, 70569 Stuttgart
- Weitere Informationen
- E-Mail schreiben
- Allgemeine Kontaktadresse des IMS
Webmaster des IMS
- E-Mail schreiben
- Bei Problemen mit den Webseiten kontaktieren Sie den Webmaster direkt