(Computer-)Linguistik: Was ist das eigentlich?

Ein Leitfaden für Interessierte

Die Sprache ist eine der wesentlichen Errungenschaften des Menschen. Durch sie unterscheidet er sich - stärker vielleicht als durch irgendeine andere Eigenschaft - von anderen Lebewesen; sie ist das Medium seiner höchsten Leistungen in Dichtung und Wissenschaft. Und natürlich ermöglicht sie die menschliche Kommunikation und menschliche Gesellschaft im wesentlichen Sinne. Die Frage, wie Sprache funktioniert, ist damit eine Grundfrage über die Art und Einzigartigkeit des menschlichen Geistes und der menschlichen Kultur.

Die Wissenschaft, die sich mit der Struktur und dem Funktionieren der Sprache befasst, ist die Linguistik (oder Sprachwissenschaft), die untersucht, wie es uns möglich ist, durch Anwendung einmal erworbener Prinzipien immer neue Gedanken in Worte zu fassen oder aus den Worten anderer zu erschließen. Auch die Computerlinguistik untersucht, auf welche Weise Wörter, Sätze, Texte und Dialoge das bedeuten können, was sie bedeuten. Aber sie studiert die Sprache aus einem besonderen Blickwinkel und mit einem spezifischen Ziel; ihr geht es darum, die sprachlichen Gesetzmäßigkeiten völlig explizit zu machen, um auf dieser Basis Rechnersysteme zu erstellen, die Sprache verstehen und produzieren können.

Welche Art von Fachwissen bei der Bewältigung computerlinguistischer Probleme benötigt wird und wie die verschiedenen Teilbereiche der Sprachwissenschaft und Informatik dabei einander ergänzen, lässt sich am besten anhand eines kleinen Beispiels veranschaulichen.

Gaby und Heinz, Informatik-Viertsemester an irgendeiner deutschen Universität, spielen mit dem Gedanken, ComputerlinguistInnen zu werden: Heinz interessiert sich für experimentelle Phonetik, Gaby für logische Semantik. Leider bietet ihre Hochschule keinen entsprechenden Studiengang an, jedenfalls keinen mit Diplom-Abschluss, auf den vor allem Heinz Wert legt. Gaby erfährt nun, dass es da eine Datenbank gibt, die Informationen über die an deutschen Universitäten angebotenen Studiengänge enthält, und die sich telefonisch abfragen lässt. Sie ruft daher die angegebene Nummer an und spricht wie folgt ins Mikrofon ihres Telefons:

"Kann man sich in irgendeinem Diplomstudiengang auf Phonetik und Semantik spezialisieren?"
Die Antwort lässt nicht lange auf sich warten: nach wenigen Sekunden gibt eine freundliche Stimme eine kurze Liste von Studiengängen durch - unter ihnen der Diplomstudiengang Linguistik an der Universität Stuttgart. Gaby bedankt sich für die prompte Antwort, legt auf und berichtet am Abend ihrem Freund Heinz von ihrer telefonischen Anfrage und dem Resultat. Die beiden beschließen, mehr Informationsmaterial über die von der Datenbank genannten Studiengänge anzufordern. Vielleicht werden wir die beiden ja demnächst in Stuttgart begrüßen können.

Die Auskunft der Datenbank erfolgte automatisch: ein Computer am anderen Ende der Leitung hat Gabys Anfrage aufgenommen, interpretiert und beantwortet. Wie funktioniert so etwas? Genau dafür werden computerlinguistische Programme und Methoden eingesetzt. Denn natürlich ist der Computer nicht auf Gabys spezielle Anfrage vorbereitet; andererseits verfügt er schon über die erfragte Information - etwa in Form von Tabelle 1 angeordnet. Aber er muss wissen, nach welcher Information überhaupt gefragt wurde. Und dazu muss er Gabys mündliche Anfrage als Suchbefehl verstehen können und dann das Ergebnis in einer für Gaby verständlichen Sprache wiedergeben. Schauen wir uns kurz an, wie so etwas funktioniert, um so einen ersten Einblick in die Fragestellungen und Teilgebiete der Computerlinguistik zu gewinnen.

Abschlüsse
Universität Fach Abschlüsse Anschrift
Jena Informatik Diplom, Lehramt Friedrich-Schiller-Universität
Fakultät für Mathematik und Informatik
07740 Jena
Stuttgart Linguistik Diplom, Magister Institut für Maschinelle Sprachverarbeitung (IMS)
Azenbergstraße 12
70174 Stuttgart
...

Mögliche Vertiefungen
Gebiet Studienfach Studienort
Digitale Bildverarbeitung Informatik Jena, ...
Phonetik Linguistik/ Sprachwissenschaft München, Stuttgart, ...
Semantik Linguistik/ Sprachwissenschaft Münster, Stuttgart, ...
...

Abbildung 1: Beispieldatenbank

Am Anfang der Auswertung von Gabys Anfrage steht die Spracherkennung (ein Anwendungsbereich für Phonetik, Statistik und Signalverarbeitung) in der es darum geht, in einen akustischen Brei eine Folge deutscher Wörter hineinzulesen. Die akustische Eingabe wird dazu im Computer in Form eines sogenannten Sonagramms repräsentiert, das für das Wort Diplomstudiengang folgendermaßen aussieht:

Sonagramm
Abbildung 2: Sonagramm

Mit Hilfe statistischer Methoden werden dann Hypothesen darüber, um welche Lautfolge es sich bei den im Sonagramm festgehaltenen Daten handeln könnte, aufgestellt und miteinander verglichen. So lässt sich z.B. die Wortfolge kann man bei schneller Aussprache kaum von Kammer unterscheiden; und eine Sächsin wie Gaby spricht ein Wort wie spezialisieren sicher anders aus als der Hamburger Heinz. Das Ergebnis der automatischen Spracherkennnung ist eine Zerlegung in Einzellaute und -wörter (Segmentierung), wie sie in Abbildung 2 eingezeichnet ist.

Die Identifikation einer Äußerung ist keine rein akustische Angelegenheit. Denn sowohl die genannten Dialektunterschiede und Verschleifungen als auch viele andere für die Spracherkennung wichtige Faktoren unterliegen sprachlichen Regularitäten, die sich nicht in rein physikalischen Begriffen fassen lassen. So ist beispielsweise die Verschleifung von kann man zu kamman nicht nur Ausdruck von Mundfaulheit, sondern gehorcht zugleich den Artikulationsregeln der deutschen Umgangssprache: in anderen Sprachen, ja sogar schon in anderen sprachlichen Kontexten ist die Verschleifung von n + m zu m nicht möglich; so sagt man z.B. nicht Ummut für Unmut. Diese Art von lautlichen Gesetzmäßigkeiten untersucht die Phonologie, in der die Laute einer Sprache als symbolisches System beschrieben werden. Zu diesem Lautsystem gehören auch die Betonungs- und Intonationsgesetze; letztere können zum Beispiel dazu beitragen, dass Gabys Äußerung als Frage verstanden wird. In der Phonologie sind exakte Notationssysteme entwickelt worden, die es gestatten, diejenigen Aspekte der Lautstruktur, die für ihre Interpretation wichtig sind, eindeutig zu charakterisieren. Die Intonationsstruktur-Zerlegung der Anfrage in Einzellaute (Phoneme) wird z.B. durch eine Abfolge hoher (high) und tiefer (low) Töne dargestellt:

Beispielabbildung zur Intonation
Beispielabbildung zur Intonation
Abbildung 3: Intonatorische Analyse von Gabys Anfrage

Will man ein gegebenes Sprachsignal als deutschen Satz identifizieren, genügt es nicht, ihn in einzelne Teile zu zerlegen, die dann in einer vorgegebenen Liste, dem Lexikon des Deutschen, nachgeschlagen werden. Zunächst einmal besteht Gabys Frage nicht aus Wörtern, sondern aus Wortformen: irgendeinem ist der Dativ von irgendein, kann die 3. Person Singular von können etc. Und ein Lexikon, das all diese Wortformen einzeln auflistet, wäre wenig praktikabel und hoffnungslos redundant. Denn zwischen den Wortformen und den dazugehörigen Wörtern bestehen systematische Zusammenhänge, die in der Morphologie, der Lehre von der Zusammensetzung der Wörter, beschrieben werden. Die Morphologie deckt also einen Teil dessen ab, was traditionell als Grammatik bezeichnet wird, nämlich die sog. Flexion oder Beugung. Aber auch Wortbildungsmuster werden in der Morphologie untersucht wie die Zusammensetzung von Diplomstudiengang aus Diplom und Studiengang. Das Ergebnis einer morphologischen Analyse von Gabys Anfrage ist die eindeutige Identifizierung ihrer Teile als Formen bestimmter, im Lexikon aufgelisteter Wörter. Es lässt sich etwa folgendermaßen darstellen:

detaillierte morphologische 
Analyse von Gabys Anfrage
Abbildung 4: Morphologische Analyse von Gabys Eingabe

Die morphologische Analyse sagt noch nichts über die Beziehungen der Wortformen im Satz aus: man ist das Subjekt, sich bezieht sich auf man (und nicht auf Studiengang) usw. Diese grammatischen Beziehungen bilden den Gegenstandsbereich der Syntax. Die genaue Analyse der syntaktischen Struktur eines Satzes ermöglicht überhaupt erst dessen Interpretation; so macht die spezielle Wortstellung (mit dem finiten Verb am Anfang) Gabys Äußerung eindeutig als Frage(-satz) kenntlich. Die syntaktische Struktur eines Satzes lässt sich weitgehend in Form eines sogenannten Baum-Diagramms darstellen:

syntaktische Analyse von 
Gabys Anfrage
Abbildung 5: Syntaktische Analyse von Gabys Anfrage

Dieses Baum-Diagramm stellt die verschiedenen Ebenen der Zusammengehörigkeit der Teile von Gabys Anfrage dar und kategorisiert sie unter syntaktischen Gesichtspunkten: PP steht dabei für Präpositionalphrase, NP[nom] für Nominalphrase im Nominativ, V[inf] für Verb im Infinitiv etc. Das Diagramm liefert noch keine echte Interpretation; eine solche muss ja über die sprachliche Form hinausgehen - nämlich in den Bereich des Inhalts, für den die Semantik zuständig ist. In der semantischen Analyse werden die syntaktischen Bezüge in logische Operationen übersetzt, denen im vorliegenden Fall wiederum Suchprozeduren entsprechen. Spätestens hier müssen auch eventuelle Mehrdeutigkeiten entdeckt und aufgelöst werden. So kann man Gabys Anfrage in zweierlei Sinn verstehen, nämlich als Frage nach der Möglichkeit einer gleichzeitigen oder aber einer alternativen Spezialisierung, wobei Gaby natürlich letzteres im Sinn hat. Der Unterschied zwischen diesen beiden Lesarten schlägt sich in verschiedenen semantischen Repräsentationen nieder:

semantische Analyse von 
Gabys Anfrage
Abbildung 6: Alternative semantische Repräsentationen von Gabys Anfrage

Aus diesen durch die semantische Analyse bereitgestellten Lesarten muss nun die richtige ausgewählt werden. Die Kriterien für die Auswahl der in einer bestimmten Situation am ehesten gemeinten Lesart werden in der Pragmatik (= Lehre vom Verwendungszweck sprachlicher Ausdrücke) systematisch untersucht. Zur Pragmatik gehört schließlich auch, dass im Falle einer positiven Antwort auf Gabys Anfrage das System nicht nur einfach mit Ja antworten, sondern möglichst auch eine Liste der einschlägigen Studiengänge angeben sollte.

Doch bevor dies geschehen kann, muss natürlich ein entsprechender Suchvorgang in Gang gesetzt werden, dessen Konstruktion und Effizienz ins Gebiet der Informatik fallen. Ist die Antwort auf Gabys Anfrage erst einmal gefunden, muss sie nun wiederum in eine sprachliche Form gegossen werden. An diesem Generierungsprozess einer Antwort sind wieder alle Teildisziplinen der Computerlinguistik sozusagen in spiegelbildlicher Form beteiligt: die zunächst als Datenmenge vorliegenden Information wird in eine semantische Repräsentation überführt, für die dann wiederum eine syntaktische Struktur gefunden wird, die schließlich von einem künstlichen Sprachgenerator möglichst naturgetreu ausgesprochen wird.

Vieles an dem obigen Szenario ist unrealistisch. Zum Einen gibt es noch kein so umfassendes Datenbankabfragesystem, wie wir es hier geschildert haben; aber die Forschungsarbeiten zu den einzelnen Bestandteilen und ihren Verbindungen laufen auf Hochtouren. Zum Anderen werden in der Praxis die einzelnen Verarbeitungsschritte weniger voneinander getrennt ablaufen, als es die obige Darstellung nahelegt; schon Effizienzgründe sprechen gegen eine solche Vorgehensweise. Doch das kleine Beispiel sollte auch nur einen Überblick über die Teildisziplinen der Computerlinguistik geben und einen ersten Eindruck von den Problemen vermitteln, mit denen sie sich beschäftigt.

Datenbankabfragen stellen keineswegs den einzigen Anwendungsbereich der Computerlinguistik dar. Ein weiterer Bereich, in dem gerade am IMS intensiv geforscht wird und in dem die einzelnen Teilbereiche in ähnlich komplexer Weise zusammenarbeiten, ist die automatische Übersetzung. Daneben gibt es speziellere Einsatzgebiete computerlinguistischer Methoden, in denen einzelne Teilbereiche der (Computer-)Linguistik im Vordergund stehen wie zum Beispiel die Entwicklung von Lesemaschinen für Blinde, für deren Konstruktion phonetisches Know-how eine größere Rolle spielt als syntaktisch-semantisches Wissen.