Institut

Studium

Forschung


 

HOME RESEARCH PROGRAMME STAFF LABS & EQUIPMENT ACTIVITIES


Maschinelle Segmentierung von Korpora gesprochener Sprache des IDS (Alignment-Projekt)

G. Dogil, W. Kallmeyer, M. Fach

aus: Antrag an das Ministerium für Wissenschaft, Forschung und Kunst  des Landes Baden-Württemberg auf Gewährung einer Sachhilfe im Rahmen des "Sonderforschungspools". Frühjahr 1998.

Die hier präsentierten inhaltlichen Teile unseres Antrags sind auch als Postscriptdatei erhältlich (ps.gz).


Inhalt

1. Zusammenfassung
2. Stand der Forschung, eigene Vorarbeiten
3. Ziele und Arbeitsprogramm


1. Zusammenfassung

Ziel dieses Projektes ist ein automatisches Alignment von Daten gesprochener Sprache des IDS. Unter Alignment ist die Segmentierung und Annotation von Sprachsignal und zugehörigem Text zu verstehen. Das Ergebnis dieser Bearbeitung ist eine maschinenlesbare Repräsentation der Sprachaufnahmen.

Für das IDS bietet diese Repräsentation die einfachste und schnellste Möglichkeit, die direkte Abbildung von Text auf Sprachsignal in die dort entwickelte Datenbank COSMAS zu integrieren. Die Bereitstellung so immenser maschinenlesbarer Daten stellt eine wesentliche Voraussetzung für die Weiterentwicklung der Sprachtechnologien wie Sprachsynthese und Spracherkennung am IMS dar.


HOME RESEARCH PROGRAMME STAFF LABS & EQUIPMENT ACTIVITIES