Institut

Studium

Forschung


 

Kommentiertes Vorlesungsverzeichnis SS 1999

Institut für Maschinelle Sprachverarbeitung

(zum Inhaltsverzeichnis)


1) PS 4: Logik und Formale Grundlagen II

Kamp / Di 9.45 - 11.15 und Do 11.30 - 13.00 / 12.21 


2) PS 4: Einführung in die Computerlinguistik

Reyle / Mo 11.30 - 13.00 und Mo 15.45 - 17.15 / 12.21

Der Kurs gibt einen Überblick über wesentliche Teilgebiete und Anwendungen der Computerlinguistik.

Voraussetzungen: Prolog

Literatur: Wird bekannt gegeben.


3) PS 4 : Syntax I

Rohrer / Fortman / Mo 9.45 - 11.15, Do 14.00 - 15.30 / 12.21

Das Seminar bietet eine Einführung in die LFG.Es sollen der Formalismus der LFG, ihre Repräsentationen und Regeln
erarbeitet werden. Daneben werden die Besonderheiten der Syntax des Deutschen erarbeitet. Textgrundlage ist das Seminarskript "Grammatische Analyse". 

Literatur:

A. Wöllstein-Leisten, A. Heilmann, P. Stepan, S. Vikner: Grammatische Analyse 

4) PS 4: Statistische Methoden

Wokurek / Mo, Do 11.30 - 13.00 / 3.11

Zielgruppe: Diplomstudium Computerlinguistik

Voraussetzung: Formale Grundlagen der CL

Das Seminar führt in Grundbegriffe der Wahrscheinlichkeitstheorie, der Statistik und der Informationstheorie ein. Die methodische Grundlagen zur statistischen Bewertung von Experimenten werden vorgestellt und anhand von Beispielen mit Hilfe des Rechners eingeübt. Der Schwerpunkt des Seminars liegt in der Vorstellung und Anwendung von statistischen Folgerungen und Klassifikationen fur die maschinelle Sprachverarbeitung.

Literatur:

Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik, Vieweg, 1991. 
T.Rietveld, R. van Hout, Statistical Techniques for the Study of Language and Language Bahaviour, 
Mounton de Gruyter, 1993 Bamberg, Baur, Statistik, Oldenburg. 
Urban D., Becker-Richter, Bruns Th., Systematische Statistik für die computergestützte Datenanalyse, 
Gustav Fischer Verlag, 1992 

5) PS 2: Einführung in die Morphologie

Lüdeling / Fitschen / Lezius / Mi 14.00 - 15.30 / 12.21

Kursbeschreibung:
Die Morphologie hat einerseits eigene Gesetzmäßigkeiten und Prinzipien, weshalb sie oft als ein eigenes
"Modul" innerhalb einer Grammatiktheorie angesehen wird. Andererseits können viele morphologische Prozesse nicht unabhängig von phonologischer, lexikalisch-semantischer und/oder syntaktischer Information betrachtet werden. Zunächst werden morphologische Grundbegriffe wie Morphem, Allomorphie, Derivation, Komposition etc. vermittelt. Dann werden anhand ausgewählter Flexions- und Wortbildungsphänomene die Abängigkeiten von Morphologie und Syntax sowie von Morphologie und lexikalischer Semantik betrachtet.

Daneben ist die Morphologie für viele computerlinguistische Anwendungen Voraussetzung. Neben morphologischen Problemen der theoretischen Linguistik sollen deswegen auch computerlinguistische Ansätze und Modelle vorgestellt werden. Dies wird auf der theoretischen Seite die Two-Level-Morphologie sein, auf der praktischen Seite die am IMS entwickelte Morphologiedatenbank. Praktische Übungen mithilfe dieser Werkzeuge vertiefen die theoretischen Grundlagen.

Voraussetzung:  Einführung in die Sprachwissenschaft

Leistungsnachweis: Übungsaufgaben, Klausur

Literatur:

Einige Kapitel aus: 
Spencer, A. (1991): Morphological Theory. An Introduction to Word Structure in Generative Grammar. 
Blackwell, Oxford
Den Abschnitt über Morphologie aus:
Grewendorf, G.; Hamm, F. und Sternefeld, W. (1988): Sprachliches Wissen. Eine Einführung in moderne 
Theorien der grammatischen Beschreibung. Suhrkamp, Frankfurt
Fleischer, W. und Barz, I. (1992): Wortbildung der deutschen Gegenwartssprache. Max Niemeyer Verlag, 
Tübingen
und weitere Artikel, die während des Semesters verteilt werden

6) PS 4: Softwarelabor II

Wokurek / Schmid / Mo, Do 14 - 17:15 / 3.38 und 3.11

Zielgruppe: Diplomstudium Computerlinguistik; Alternative Studiengestaltung: "technisches Fach"

Diese Laborübung wird Studenten geisteswissenschaftlicher Studiengänge als Ergänzungslehrveranstaltung aus dem ingenieurwissenschaftlichen Bereich empfohlen.

Voraussetzung: Softwarelabor I

Dieses Labor führt in die praktische Verwendung des Computers in den Gebieten Akustische Phonetik, Phonologie und Linguistik ein.

  • Sprachanalyse und Sprachsynthese
  • Automatische Spracherkennung
  • Corpuserschließung I
  • Corpuserschließung II
  • Parsing I
  • Parsing II

Der erste Themenblock gibt eine Einführung in die akustische, phonetische und signaltechnische Aspekte der Sprachverarbeitung. Der zweite Themenblock Corpora zeigt die Verwendung der wichtigsten Werkzeuge zur Erstellung und zur Abfrage von Textkorpora. Im dritten Block werden Programme zur syntaktischen Analyse von Texten
vorgestellt.

Leistungsnachweis: Übungsprotokolle


7) HS 2: Semantik III

Bäuerle / Di 14.00 - 15.30 / 12.21

Der Kurs beschäftigt sich mit der Behandlung von Präsuppositionen und Implikaturen in einer dynamischen Semantik

Voraussetzung:  Semantik I/II
Leistungsnachweis: Referat

Literatur:

zur Orientierung: David Beaver, Presupposition, in: Benthem/ter Meulen (eds.), Handbook of Logic and 
Language, 1997.

8) HS 2: Sprachphilosophie

Bäuerle / Do 11.30 - 13.00 / 13.11

Im Kurs werden die für die (Computer)Linguistik wichtigsten Grundprobleme der analytischen Philosophie besprochen (Wahrheit - Bedeutung - Referenz) und die Anwendung der logischen Sprachanalyse auf ausgewählte philosophische Problemstellungen diskutiert.

Voraussetzung:  Semantik I
Leistungsnachweis: Referat

Literatur: ausgewählte Literatur wird zu Kursbeginn bekanntgegeben


9) HS 4: Spracherkennung I

Dogil / Mo, Do 8.00 - 9.30 / 3.11

Voraussetzung: Einführung in die Phonetik/Phonologie

In dem Seminar werden die Methoden der akustischen Analyse vermittelt. Die gängigen Methoden der Sprachaufzeichnung und Sprachanalyse werden mit Hilfe der am Institut vorhandenen Rechner eingeübt.

Literatur:

Neppert & Petursson, 1986, Elemente einer akustischen Phonetik, Buske Verlag: Hamburg. 
Lass N.J., 1996, Principles of Experimental Phonetics, Mosby: St. Louis etc. 

Beide Bücher sind in den Institutsbibliotheken (IMS, KII) mehrfach vorhanden. 

Homepage: http://www.cse.ogi.edu/CSLU/cse551/why.html http://www.phonetik.uni-muenchen.de/SGL/SGLHome.html


10) V 2: Sprache und Gehirn

Dogil / Do 15.45 - 17.15 / 17.01 (KII)

Vorlesung: Studium Generale, Linguistik, Germanistik, Anglistik, Romanistik

keine Voraussetzungen

Die modernen bildgebenden Verfahren der Neuroradiologie (PET, fMRI) haben zu großen Fortschritten in der Lokalisation und Interpretation der neuronalen Substrate der allgemeinen motorischen und sensorischen Systeme ermöglicht. Im Gegensatz dazu, stehen die eher uneinheitlichen Ergebnisse der Versuche, die spezifischen kognitiven
Prozesse "bildhaft" zu machen.  In der Vorlesung wird in die Methodologie der bildgebenden funktionellen Neurolinguistik eingeführt, und es werden einige ausgewählte Studien besprochen. Auf methodologische  Einschränkungen solcher Studien, sowie auf mangelhafte interdisziplinäre Vorbereitung der Experimente wird hingewiesen. Die Ergebnisse der funktionellen in vivo Untersuchungen werden mit den Ergebnissen der klassischen (d.h. klinischen) Neurolinguistik verglichen.

Literatur:

Deacon, T. 1998. The Symbolic Species: The Co-Evolution of Language and the Brain. W.W. Norton & Co. 
(Taschenbuch, 528 Seiten, DM 26,70, bei www.amzon.de) 
Poeppel, D. 1996. A Critical Review of PET Studies of Phonological Processing. Brain & Language 55: 
317-351. 
Demonet, J. et al 1996. A Critical Reply to Poeppel.  Brain & Language 55: 352-379. 
Poeppel, D. 1996. Response to Demonet et al. Brain & Language 55: 380-385. 
Jaeger, J. et al 1996. A PET study of regular and irregular verb morphology in English. Language 
72: 451-497. 
Seidenberg, M. & J. H. Hoeffner. 1998. Evaluating behavioural and neuroimaging data on past 
tense processing. Language 74: 104-122. 
Jaeger, J., van Valin, R., Lockwood, A. 1998. Response to Seidenberg & Hoeffner. Language 74: 
123-128. 

Homepage: Sprache & Gehirn - Ein neurolinguistisches Tutorial


11) HS 2: Kolloqium für Examenskandidaten

Dogil / Mo 14.00 - 15.30


12) HS 2: MÜ I:

Heid / Wedekind / Do 9.45 - 11.15 / 13.11


13) HS 2: Logisch-semantisches Kolloquium

Kamp / Di 11.30 - 13.00 / 2.14


14) HS 4: Pragmatik

Bäuerle / Kamp / Mo 11.30 - 13.00 und Mi 9.45 - 11.15 / 12.21

Zielgruppe: HF Linguistik(Diplom/MA), HF Informatik mit NF Linguistik

Man unterscheidet auf der Bedeutungsebene zwischen semantischen und pragmatischen Aspekten. In der Kommunikation, und a forteriori in der Computerlinguistik, ist aber eine Interaktion beider Ebenen unabdingbar. Die Veranstaltung will anhand konkreter Beispiele die Gegenstände der Pragmatik identifizieren und auf der Basis der semantischen Repräsentationen der DRT eine integrierte Behandlung von semantischen und pragmatischen Aspekten diskutieren. Schwerpunktmäßig werden die etablierten Bereiche Deixis, Präsupposition, Implikatur und Sprechakte behandelt. Eingegangen wird aber auch auf Diskursrelationen, Konversationsanalyse und Topic/Focus.

Voraussetzung: Semantik I/II, DRT-Kenntnisse

Leistungsnachweis: Referat oder Klausur


15) HS 2: Dialogsemantik und -Pragmatik

Kamp / Eberle / Fr 9.45 - 11.15

Folgende Themen werden besprochen und bearbeitet:

  1. Allgemeine Darstellung der Probleme. DRT-bezogene Grundlagen
  2. Ausarbeitung eines elementaren Konstruktionsalgorithmus für Dialoge
  3. Definite Deskriptionen: Diskussion von spezifischer, referentieller, attributiver und direkter Referenz; Sprecher- vs.
    Hörereinstellungen
  4. Shared Knowledge und Konstruktionsregeln für die unterschiedlichen Typen von definiten und indefiniten NPs
  5. Präsuppositionen
  6. Sprechakttypen, Sprechaktpaare, Regeln der Kommunikation, Indirekte Sprechakte, Gemeinsame Intentionen

Literatur: wird angegeben


16) HS 2: Information Retrieval

König-Baumer / Mo 14.00 - 15.30 / 12.21

Voraussetzungen: Grundkenntnisse Informatik

Fast jede WWW-BenutzerIn hat schon von Search Engines, also einer Art von Information Retrieval (IR) oder Text Retrieval Systemen Gebrauch gemacht. Dieses Seminar soll einen Überblick geben über

  • gängige Methoden und Begriffe des 'klassischen' Information Retrieval
  • stärker linguistisch basierte Methoden (inhaltsbezogenes IR, Methoden zur Fachwort-Extraktion, ...)
  • verschiedene Einsatzmöglichkeiten von IR Systemen und F+E Projekte, die sich mit IR befassen

Der Kurs wird sich zum großen Teil am Manuskript von Fuhr orientieren und u.a. die folgenden Begriffe und Verfahren einführen: Recall/Precision, Thesauri, Vektorraummodell, probabilistische Modelle, Architekturen von IR Systemen.

Leistungsnachweis: Vortrag im Seminar mit ausgearbeitetem Handout.

Literatur:

Frakes, W.; Baeza-Yates, R.: Information Retrieval. Data Structures and Algorithms, Prentice-Hall, N.J., 
1992 
Norbert Fuhr: Information Retrieval. Manuskript. Universität Dortmund, 1996. 
C. J. van Rijsbergen: Information Retrieval. 1979. (vergriffen) 
Salton, G.; McGill,M.J.: Introduction to Modern Information Retrieval. McGraw-Hill, New York 1983.

17) HS 2: Algorithmen und Datenstrukturen zum Operieren auf großen Textmengen

Lezius / Fr 9.45 - 11.15 / 13.11

Zielgruppe: Dipl.-Ling.: 3. Sem., Dipl.-Inf.: Nebenfach

Obwohl immer mehr moderne Programmiersprachen wie z.B. Java den Entwickler mit einer Vielzahl vorgefertigter Module unterstützen (Hashtables usw.), ist ein grundlegendes Verständnis der Methoden Voraussetzung für deren
Anwendung. In den Bereichen der Korpuslinguistik und des Information Retrieval ist darüberhinaus die Implementierung und Anpassung von Standardalgorithmen erforderlich, die eine effiziente Verarbeitung sehr großer Datenmengen realisieren.

Voraussichtliches Programm:

  1. Sortieren
    • Sortieren auf externem Datenträger
  2. Suchen
    • selbstanordnende lineare Listen
    • invertierte Listen
    • Hashtables
    • Tree Structures
    • B-Bäume
  3. Suche in Texten
    • Boyer-Moore-Algorithmus o.ä.
    • PAT trees, PAT arrays

Voraussetzung: Software-Labor I und II
Leistungsnachweis: Übungsaufgaben

Literatur:

Ottmann/Widmayer: Algorithmen und Datenstrukturen
Frakes/Baeza-Yates: Information Retrieval - Data Structures & Algorithms
Knuth: The art of computer programming

18) HS 2: Deduktionssysteme

König-Baumer / Fr 14.00 - 15.30 / 12.21

Zielgruppe: Informatiker und Computerlinguisten im Hauptstudium

Vorraussetzung: Grundkenntnisse Logik

Automatische Beweiser sind zentraler Bestandteil vieler Systeme aus dem Bereich der KI und stellen insbesondere für das logische Programmieren eine notwendige technische Voraussetzung dar. Im Seminar werden die Grundlagen für Deduktionssysteme verschiedenster Art behandelt. Die Themen umfassen u.a. Kalküle für Prädikatenlogik - insbesondere verschiedene Varianten der Resolutionsmethode, sowie Kalküle des natürlichen Schließens - und verschiedene Repräsentationsmethoden für solche Kalküle wie Tableaux, Connection-Graph-Methode, oder Matrix-Methode. Besonderes Augenmerk wird auf die Grundlagen für das gängige Paradigma des logisches Programmierens, das Programmieren mit definiten Klauseln, gelegt. Ausserdem werden constraint-basierte Systeme besprochen.

Leistungsnachweis: Vortrag im Seminar mit ausgearbeitetem Handout.

Literatur:

Hofbauer/Kutsche (1991). Grundlagen des maschinellen Beweisens, Vieweg, ISBN 3-528-14718-0 (2.Aufl.)
weitere Literatur wird bekannt gegeben

19) HS 2: Prozessphonologie

Luschützky / Mi 14.00 - 15.30 / 13.11

Zielgruppe: Phonetiker und Phonologen

Geboten wird eine problemorientierte Darstellung prozesstypologischer Ansätze in der Phonologie mit besonderer Berücksichtigung phonetischer Grundlagen und der Interaktion segmentaler und prosodischer Faktoren. Erwartet wird die Bereitschaft zur Diskussion.

Voraussetzung: Einführung in die Phonetik und Einführung in die Phonologie

Leistungsnachweis: In Abhängigkeit von der Teilnehmerzahl entweder ein Referat oder eine
schriftliche Arbeit

Literatur:

Hans Christian Luschützky, Sixteen possible types of natural phonological processes. In: 
Wiener linguistische Gazette 42/43 (1988),79-103.
Hans Christian Luschützky, Synchrone und diachrone Aspekte der phonologischen 
Prozesstypologie. Wien: WUV-Universitätsverlag 1997.

20) HS 2: Sprachtypologie

Luschützky / Do 15.45 - 17.15 / 13.11

Zielgruppe: Studierende aller linguistischen Fächer

Geboten wird eine Einführung in die Sprachtypologie auf forschungsgeschichtlicher Grundlage; darauf aufbauend eine Vertiefung in moderne sprachtypologische Konzeptionen mit Schwerpunktsetzung in Phonologie. Erwartet wird die Bereitschaft, sich aktiv mit konkretem Sprachmaterial "exotischer" Sprachen auseinanderzusetzen.

Voraussetzung: Einführung in die allgemeine Sprachwissenschaft und Einführung in die
Phonologie

Leistungsnachweis: Klausur

Literatur:

William Croft, Typology and Universals. Cambridge: Cambridge University Press 1990.
Hans Christian Luschützky, Sprachtypologie. In: Einführung in die synchrone Sprachwissenschaft, 
ed. Peter Ernst, Wien: Edition Praesens 1997.

21) HS 2: Stimmqualität

Marasek / Fr 9.45 - 11.15 / 3.11

Das Seminar bietet eine Einführung in die Aspekte der Stimmqualität. Die wichtigsten Stimmeigenschaften und die Wirkung der Stellung der Stimmorgane auf die Stimme werden vorgestellt. Auch die Methoden der objektiven Beurteilung der Stimmqualität werden vermitteln, insbesondere wird der Verlauf der Phonation anhand akustischer und
EGG-Methoden interpretiert.

Voraussetzungen: Einführung in die Phonetik
Zielgruppe: CL

Literatur:

Eckert H.,, Laver J., Menschen und ihre Stimmen - Apsekte der vokalen Kommunikation, Beltz, 
Psychologie Verlags Union, Weinheim 1994.
Titze I., Principles of voice production, Prentice Hall, Englewood Cliffs,1994.
Laver J., The gift of speech, Edinburgh University Press, Edinburgh, 1991.

22) HS 2: Neurogene Sprechstörungen

Mayer / Classen / Mi 14.00 - 15.30 / 17.22 (KII)

Zielgruppe: Linguisten (Dipl. und MA) im HS

Thema des Seminars ist die phonologische und phonetische Analyse verschiedener  Sprechstörungen, die im Rahmen von neurologischen Erkrankungen auftreten. Schwerpunkt des Seminars bildet die Diagnostik der segmentalen und suprasegmentalen Symptomatik bei verschiedenen Formen der Dysarthrophonie. Daneben werden jedoch auch andere Syndrome mit ähnlichen Störungsbildern (z.B. Sprechapraxie) behandelt.

Voraussetzungen: Einführung in die Phonetik/Phonologie wäre sinnvoll.
Leistungsnachweis: n.V.

Literatur:

W. Ziegler 1998, Dysarthrie, Thieme Verlag.

23) HS 2: Corpora annotieren: Kodierung und Verarbeitung linguistischer Beschreibung

Mengel / Di 15.45 - 17.15

Die Verarbeitung gesprochener Sprache ist in den letzten Jahren in verstärktem Maße vorangetrieben worden. Diesem
technologischen Fortschritt steht die fehlende Standardisierung der Beschreibung linguistischer Information gegenüber, die für die Wiederverwertbarkeit der Sprachdaten dramatische Folgen hat. In diesem Seminar werden vor dem Hintergrund der Standardisierungsbemühungen innerhalb des Projektes MATE folgende Themen behandelt: Existierende linguistische und Sprachdatenbasen, kodierte vs. nichtkodierte Bereiche, verwendete Kodierungsstandards, Voraussetzungen für eine effektive Kodierung, Interaktion zwischen Theorie und Markup, Interaktion zwischen Markup und Verarbeitbarkeit, Annotation und Testen verschiedener Kodierungen mit dem MATE-Tool.

Voraussetzungen: Vordiplom

Leistungsnachweis:

  • unbenoteter Teilnahmeschein: regelmäßige Teilnahme und die Erledigung von Übungsaufgaben;
  • benoteter Leistungsschein (für z.B. Informatiker): zusätzlich eine Hausarbeit am Ende des Semesters

Literatur: wird am Anfang des Semesters zur Verfügung gestellt, größtenteils elektronisch verfügbare Texte


 

24) HS 2: Bewußtsein und Bedeutung

Merin / Fr 14.00 -15.30

Die Bewußtseinsphilosophie hat in den letzten Jahren wieder verstärkt Konjunktur in der Diskussion zur Kognition. Nicht allen Bedeutungstheoretikern bedeutet sie jedoch entsprechend viel. Aufgabe des Seminars soll es sein, die Beziehung zwischen Bewußtsein und Bedeutung klarer erkenntlich werden zu lassen, als sie dies derzeit ist.

Voraussetzungen: Grundkenntnisse Semantik und (Sprach-)Philosophie;
                             Voranmeldung per e-mail bis spätestens 2 Wochen vor Semesterbeginn.
Leistungsnachweis: für ausgearbeitetes Referat.

Literatur: in der ersten Sitzung


25) HS 2: Sprachsynthese II

Möbius / Di 15.45 - 17.15 / 3.11

Zielgruppe: Diplomstudium Computerlinguistik

Bei der Konversion von Text in Lautsprache (text-to-speech, TTS) lassen sich prinzipiell zwei Schritte unterscheiden, linguistische Analyse und akustische Sprachsynthese. Während das Seminar Sprachsynthese I den Schwerpunkt auf die akustische Synthese legte, sollen in Teil II die linguistischen Komponenten eines TTS-Systems im Mittelpunkt stehen.

Die folgenden Probleme der linguistischen Textanalyse sollen besprochen werden: Erstellung des Lexikons einschließlich morphologischer Paradigmata, Kompositazerlegung und Analyse unbekannter Wörter, Disambiguierung, phonologische Prozesse und Ausspracheregeln. Die einzelnen Probleme, und Methoden und Techniken zu ihrer Lösung, sollen anhand kleiner praktischer Übungen veranschaulicht werden, wobei auch die Implementierung linguistischer Beschreibungen, z.B. in Form von Finite-State-Maschinen, thematisiert wird. Bei Interesse können die Übungen auch in weiterführende Projekte (Studienarbeit, Diplom-/Magisterarbeit) münden.

Voraussetzungen: Sprachsynthese I (empfohlen)

Leistungsnachweis: Übungsaufgaben, Klausur.

Literatur:

Richard Sproat (Hg.) (1998): Multilingual Text-to-Speech Synthesis. Kluwer, Dordrecht
Thierry Dutoit (1997): An Introduction to Text-to-Speech Synthesis. Kluwer, Dordrecht

26) HS 2: Intonations- und Lautdauermodelle

Möbius / Mo 9.45 - 11.15 / 13.11

Zielgruppe: Diplomstudium Computerlinguistik

Der Stand der Forschung auf dem Gebiet der Prosodie, insbesondere der Intonation, läßt sich als äußerst divers und kontrovers charakterisieren. Dies trifft sowohl auf die phonologische als auch auf die phonetische Beschreibungsebene zu. In diesem Seminar sollen die wichtigsten aktuellen Intonationsmodelle besprochen werden, und zwar sowohl hinsichtlich ihrer phonologischen Grundlagen und Annahmen als auch unter dem Aspekt ihrer Implementierung und Anwendung, z.B. in Sprachsynthesesystemen.

Weiterhin soll das prosodische Merkmal Lautdauer und seine Modellierung in praktischen Anwendungen besprochen werden. Die wichtigsten aktuellen Ansätze unterscheiden sich bezüglich ihrer jeweiligen theoretischen Annahmen (Stichworte: speech timing, synchrony assumption).

Je nach Vorkenntnissen der Teilnehmer soll zu Beginn des Seminars zunächst die prosodische Terminologie erarbeitet werden.

Voraussetzungen: Einführung in die Phonetik und Phonologie

Leistungsnachweis: Referat und schriftliche Ausarbeitung.

Literatur:

Die Beiträge von Beckman, Gronnum, Ladd und Möbius in: Proc. 13th Internat. Congr. of Phonetic Sciences, 
Vol. 1, Stockholm, 1995
D. Robert Ladd (1996): Intonational phonology. Cambridge University Press

27) HS 2: Analyse des Japanischen mittels LFG

Nanz / Do 8;00-9.30 im KII

In dieser Veranstaltung soll die japanische Sprache mittels der LFG (Lexical Functional Grammar) analysiert werden.
Schwerpunktmäßig werden wir uns dabei mit Relativsätzen, Topik, Benefaktiva, Passiv, Kausativ, Reflexivpronomina auseinandersetzen. Ferner soll das Problem der Höflichkeitssprache im Japanischen unter dem Aspekt der Möglichkeit einer LFG-Analyse untersucht werden. Zu Beginn der Veranstaltung erfolgt eine kurze Einfuehrung in LFG. Japanischkenntnisse werden nicht vorausgesetzt.

Literatur: Literaturhinweise in der ersten Sitzung.


 

28) HS 2: Spracherkennung III

Regel-Brietzmann (Daimler Benz, Ulm) / Mi 15.45 - 17.15 / 3.11

Voraussetzung: Grundlagen der Phonetik und Signalverarbeitung sind nützlich, aber nicht Voraussetzung.

Zielgruppe: CL, Informatik

Das Seminar teilt sich in einen theoretischen Teil und einen praktischen Teil am Rechner. Der theoretische Teil enthält die Grundlagen der automatischen Spracherkennung. Den Schwerpunkt bilden die Hidden-Markov-Modelle. Außerdem sind Spezialthemen, die im praktischen Teil umgesetzt werden, Inhalt des Seminars. Der praktische Teil enthält eine Übung am Rechner, die den Umgang mit dem Hidden-Markov-Toolkit (HTK) und das Erarbeiten spezieller Probleme der Spracherkennung zum Ziel hat (z.B. optimale Wortuntereinheiten, Aussprachevarianten, Sprechererkennung).


29) HS 2: Probabilistisches Clustering fuer NLP-Anwendungen

Riezler / Prescher / Di 11.30 - 13.00 / 13.11 (Achtung: Beginn am 20. 4. !!!)

Die Lehrveranstaltung führt in die Grundlagen des probabilistischen Clustering für NLP-Anwendungen wie z.B. Wort-Sinn-Disambiguierung, Smoothing, Parse-Ranking, Text-Klassifikation, Disambiguierung in Maschineller Übersetzung, etc. ein.

Vorläufiges Programm:

  • Einführung in Grundlagen der Wahrscheinlichkeitstheorie und Statistik (abhänging vom Wissensstand der Teilnehmer)
  • Besprechung bekannter Arbeiten (siehe Literaturliste)
  • Vorstellung eigener Arbeiten

Voraussetzung: Grundlagen der Wahrscheinlichkeitstheorie und Statistik

Leistungsnachweis: nach Vereinbarung

Literatur:

Brown, P., et al. (1992). Class-Based n-gram Models of Natural Language. In Computational 
Linguistics 18, 4.
Pereira, F., Tishby, N., Lee, L. (1993). Distributional Clustering of English Words. In Proc. 
of ACL 31.
Schuetze, H. (1992). Dimensions of Meaning. In Proceedings of Supercomputing '92.
Yarowsky, D. (1993). Unsupervised Word Sense Disambiguation Rivaling Supervised Methods.
Rooth, M. (1993). Two-dimensional clusters in grammatical relations. In Proc. of IJCAI'93.
Dagan, I., Lee, L., Pereira, F. (erscheint). Similarity-Based Models of Word Cooccurrence 
Probabilities. In Machine Learning.
Baker, D., McCallum A. (1998). Distributional Clustering of Words for Text Classification. 
In SIGIR' 98.

30) HS 2: Statistische Methoden III

Riezler / Do 9.45 - 11.15 / 3.23

Die Lehrveranstaltung findet als Lesegruppe statt, in der neuere Arbeiten zu statistischen Methoden in der Computerlinguistik besprochen werden. Mögliche Themen: Maximum-Entropy-Modelle, Bayes'sche Netze, andere Graphische Modelle.

Voraussetzung: Wahrscheinlichkeitstheorie und Statistik

Leistungsnachweis: nach Vereinbarung

Literatur: wird bekanntgegeben


31) HS 2: Maschinelle Lexikologie und Lexikographie: Mehrwortausdr�cke in Corpus und Lexikon

Rohrer / Heid / Mi 9.45 - 11.15 / 12.21

Zielgruppe: Computerlinguisten im Hauptstudium (Schwerpunkt Maschinelle Lexikologie und Lexikographie);
interessierte Studenten aus den Einzelphilologien  (Schwerpunkt Linguistik)

Inhalt und Ziel:
Das Seminar behandelt Mehrwortausdrücke, wie beispielsweise mehrwortige Adverbien, Präpositionen und Konjunktionen ("hin und wieder", "im Sinne von", "ohne dass"), Verben mit abtrennbarem Präfix, Kollokationen ("siedend heiss", "ein voller Erfolg", "einen Vorschlag unterbreiten") und idiomatische Wendungen vom Nomen/Verb-Typ ("zur Schnecke machen", "das Kind mit dem Bad ausschütten").

Für solche und vergleichbare Konstruktionen stellen sich u.a. folgende Fragen:

  • Eingrenzung und Definition der Phänomene: Was sind Kriterien, mit denen die einzelnen Typen abgegrenzt werden können (gleichzeitig Überblick über die Forschungslage);
  • Identifikation in Corpora: Verfahren zur Extraktion der Mehrwortausdrücke aus großen Textcorpora (anhand von Beispielen für Deutsch und Englisch);
  • Repräsentation im Lexikon: Informationen, die in einem morphologischen Wörterbuch (Computational Morphology: z.B. Two-Level-Morphologie, PhraseManager etc.) minimal zu den Mehrwortausdrücken angegeben werden müssen; Informationen, die in einem Syntaxwörterbuch (Beispielfall: syntaktisches Lexikon einer LFG-Grammatik) angegeben werden müssen.

Im Seminar sollen auch praktische Arbeiten zur Extraktion von Mehrwortverbindungen aus deutschen Corpora und zu deren Beschreibung unternommen werden.

Voraussetzungen: Wünschenswert sind: LFG-Syntax (z.B. Kurs Syntax I), Grundkenntnisse
in der Corpuserschließung (z.B. HS Corpuserschließung/Wörterbuchaufbau)

Leistungsnachweis: Regelmäßige Erledigung von Hausaufgaben, z.B. zur Corpusextraktion;
ggf. Hausarbeit und/oder Referat

Literatur: Literatur zu den einzelnen Teilbereichen wird im Seminar ausgegeben;
Vorbereitungsliteratur bei U. Heid ab 15.3.99.


32) HS 2: Dialogsysteme: Aspekte der syntaktisch-semantischen und der Dialog-Verarbeitung von `SpokenLanguage Dialogue Systems'

van Kuppevelt / Heid / Di 11.30 - 13.00 / 12.21

Zielgruppe: Computerlinguisten im Hauptstudium (Bereiche Angewandte Computerlinguistik und Semantik/Pragmatik)

Inhalt und Ziel:
Das Seminar gibt zunaechst einen Ueberblick ueber Architekturen fuer Dialogsysteme (Komponenten, Interaktion der Komponenten, Ressourcen). Dabei werden verschiedene konkrete Beispielsysteme durchgesprochen (u.a. die ARISE-Systeme zur Zugauskunft, das Waxholm-System zur Schiffsfahrplanauskunft, das DaimlerBenz SLDS (verschiedene Anwendungen), Verbmobil).

Im zweiten Teil des Seminars werden ausgewaehlte Probleme der syntaktisch/semantischen Analyse (Parsing-Strategien, Umfang und Leistung von Grammatiken und Lexika) diskutiert, sowie insbesondere Fragen des Dialogmanagements (Dialogtheorien und ihre Implementierung, Dialogkontrolle, dialogue history, dialogue grammars, Interaktion zwischen Semantik und Dialogverarbeitung, Dialogbeschreibung mit den Mitteln der formalen Semantik etc.). Anhand konkreter Beispiele wird schliesslich diskutiert, welche Ansaetze fuer welche Typen von Fragestellungen und Aufgaben eines SLDS besonders adaequat sind.

Das Seminar praesentiert und nutzt Ergebnisse des seit Sommer 1997 laufenden Projekts DISC.

Voraussetzung: Kenntnisse aus Semantik I, Syntax, Parsing I.

Leistungsnachweis: Regelmaessige Mitarbeit, evtl. Hausarbeit mit Referat.

Literatur:

Niels Ole Bernsen, Laila Dybkjaer, Hans Dybkjaer: Designing Interactive Speech Systems: From First Ideas to 
User Testing (Berlin/New York: Springer), 1998.

33) HS 4: Parsing II: Statistisches Parsing

Rooth / Di 14.00 - 15.30 und Fr 11.15 - 13.00 / 3.24

The course covers algorithms, mathematical formalisms, andexperimental techniques for statistical parsing of natural language. Lab sessions use Glenn Carroll's Gramotron 98 lexicalized statistical parsing implementation.  Topics include:

  • Probabilistic context free grammar
  • Practical development of statistical grammars
  • Inside-outside and flow algorithms
  • EM algorithm
  • Practical estimation of statistical grammars
  • Probabilistic language modeling
  • Part of speech tagging
  • Latent class models of lexical selection
  • Practical evaluation of statistical grammars

Prerequisites: Formale Grundlagen II, Parsing I (or comparable experience with context free parsing algorithms)

Literatur:

Eugene Charniak, Statistical Language Learning. Cambridge: MIT Press. Glenn Carroll and 
Mats Rooth.  Statistical Parsing with Gramotron Experiments. Unpublished lecture notes.

34) HS 2: Parsing III: Statistical Grammar Development

Rooth / Mo 14.00 - 15.30 / 3.24

This is an advanced seminar concerned with development and evaluation of statistical grammars, with emphasis on the
experimental environment in use at IMS. 


35) HS 4: Algorithmische Semantik

Schiehlen / Di 9.45 - 11.15, Do 14.00 - 15.30 / 13.11

Zielgruppe: CL, Informatik

Inhalt und Ziel:
Das Seminar gibt einen Überblick über Techniken der Semantikkonstruktion, d.h. der Konstruktion semantischer Repräsentationen aus syntaktischen Ausgabestrukturen. Im ersten Teil des Seminars soll der traditionelle auf dem Lambda-Kalkül basierende Ansatz vorgestellt werden, der Feature-Strukturen in prädikatenlogische Formeln oder DRSen umwandelt (Pereira&Shieber87, Blackburn&Bos98).

Im zweiten Teil des Seminars soll auf einen neueren Ansatz eingegangen werden, mit dem aus kontextfreien Bäumen Unterspezifizierte Diskursrepräsentationsstrukturen (UDRSen, Reyle93, Frank&Reyle92) in der Form von Verbmobil Interface Terms (VITs, Dorna98) erstellt werden können. Anhand dieses Ansatzes und umfangreichen Datenmaterials
soll gezeigt werden, wie ein großer semantischer Repräsentationsformalismus datengetrieben definiert werden kann.

Voraussetzung: Algorithmische Syntax, Prologkenntnisse

Leistungsnachweis: Übungsaufgaben; ggf. Referat

Literatur:

Fernando Pereira & Stuart Shieber 1987: Prolog and Natural-Language Analysis, CSLI Lecture Note. 
Patrick Blackburn & Johan Bos 1998: Representation and Inference for Natural Language: A First 
Course in Computational Semantics. http://www.coli.uni-sb.de/~bos/comsem/
Anette Frank & Uwe Reyle 1992: How to Cope with Scrambling and Scope. in: Görz, G. (ed.): 
Konvens 92. Reihe `Informatik aktuell', Springer, Berlin, 178-187.
Uwe Reyle 1993: Dealing with Ambiguities by Underspecification: Construction, Representation 
and Deduction, Journal of Semantics 10,2.
Michael Dorna 1998: The ADT Package for the Verbmobil Interface Term, Verbmobil Report 104X.