Universität Stuttgart
Institut für maschinelle Sprachverarbeitung
Studien- und Diplomarbeiten im Bereich
Angewandte Computerlinguistik


Schwerpunkte der folgenden Angebote sind

Die Themen können je nach Vorkenntnissen und Zielsetzungen als Studienarbeiten (S), als Diplomarbeiten (D) und in bestimmten Fällen, nach Absprache auch als Hilfskraftarbeiten (H) durchgeführt werden.

Die Themen stehen mit den Forschungsthemen des Bereichs Linguistische Ressourcen der Abteilung Angewandte Computerlinguistik im Zusammenhang.

(1) Verfahren der Corpusverarbeitung

Hier liegt der Schwerpunkt auf Techniken der Corpusverarbeitung. Die Beispielcorpora sollten zum Deutschen sein, nach Absprache auch für andere Sprachen.

Themenvorschläge:

(2) Corpuslinguistik Deutsch für den Wörterbuchaufbau

Zu entwicklen sind auf CQP o.ä. beruhende Verfahren der lexikalischen Datenextraktion für Deutsch. Dabei interessieren die unten angegebenen Phänomene besonders. Alle Themen sollen parallel auch die verfügbare linguistische Literatur aufarbeiten.

Themenvorschläge:

(3) Elektronische Wörterbücher

Hier spielt die lexikalische Repräsentation eine besondere Rolle. Zum Teil soll sie ergänzt werden durch Datenextraktion. Als Modellierungsformalismus verwenden wir OWL-DL.

Themenvorschläge:

(4) Corpuslinguistik für andere Sprachen als Deutsch

Akquisition lexikalischer Informationen aus Texten

Weitere Themen sind in Vorbereitung.

Stand: 8. Dezember 2006