Studienarbeit

Thema:
Entwicklung eines "Wordspotters" zum automatischen Schneiden von Sprachsignalen
Kurzbeschreibung:

Entwicklung eines Tools, mit dem lange Sprachsignale automatisch geschnitten werden können. Unter langen Sprachsignalen werden Aufnahmen verstanden, die die Länge eines DAT-Tapes, 120 min, umfassen. Im vorliegenden konkreten Fall handelt es sich um nachgesprochene Radiosendungen. 
Ein Teil des zu entwickelnden Tools ist der Wordspotter, der eine Spezialanwendung der automatischen Spracherkennenung darstellt. Mit Hilfe des Wortspotters sollen die richtigen Zeitpunkte zum Schneiden gefunden werden, in dem das Sprachsignal nach frei definierbaren Keywords durchsucht wird. Der zweite Teil des Tools realsiert das Schneiden in einzelne, kleinere Sprachsignale. 
Idealerweise erfolgt die Benamung der geschnitten, neuen Sprachsignale durch Erkennung des Segments, das dem Keyword im Sprachsignal unmittelbar folgt. 

Methoden:
  • Aufbereitung der  Sprachsignale mit Methoden der  Signalverarbeitung 
  • Entwicklung des Wordspotters mit Entwicklungsumgebung für Spracherkennung (HTK) 
  • Perl- bzw. Scriptprogrammierung 
  • Entwicklung unter Irix (SGI) 
Voraussetzungen:
  • Besuch der Kurse Spracherkennung I & II 
  • Software Uebung II 
  • (idealerweise) Spracherkennung III 
Dauer:
3 Monate
Betreuer:
Marcus Fach, IMS-Phonetik, Zimmer 3.06
Institut für Maschinelle Sprachverarbeitung (IMS) Lehrstuhl für Experimentelle Phonetik