Institut

Studium

Forschung


 

Veranstaltungskommentare

Rainer Bäuerle: Logik III - Modallogik und Anwendungen (HS2)

 

Termine: Di 15.45-17.15, Raum 12.21

Teilnahmevoraussetzungen: Vordiplom

Leistungsnachweis: regelmäßige Hausarbeiten (Übungsaufgaben)


Rainer Bäuerle: Pragmatik (HS4)

Termine:

  • Mo 11.30-13.00, Raum 12.21
  • Mi 9.45-11.15, Raum 13.11

Greg Dogil: Graduiertenseminare: Neurocognition of language and Principles of Phonetics and Phonology (HS4)

Termine:

  • Do 9.45-11.15, Raum Büro
  • Do 11.30-13.00, Raum Büro

Kommentar: The seminar is directed to the members of the 'Graduiertenkolleg' Sprachliche Repräsentationen und ihre Interpretation, however, all the advanced students of the faculty are invited to participate. We will read and discuss a number of texts most of which are listed below.

Literatur:

Deacon, T. 1997. The Symbolic Species: the co-evolution of language and the brain. W.W. Norton, New York.
Dogil, G. et al. 2000. The Speaking Brain. Journal of Neurolinguistics 14. (in press)
Brown, C. and Hagoort, P. 1999. The Neurocognition of Language, Oxford Univ. Press.
Hall, T. 2000. Optimalitätstheorie, Kap 11 aus Phonologie: Eine Einführung. S. 317-334. de Gruyter, Berlin.
Blevins, J. 1996. The Syllable in Phonological Theory. In Goldsmith, J.(ed.) The Handbook of Phonological 
Theory. Blackwell.Pp. 206-244.
Clements, G.N. and Hume, E. 1996. The Internal Organization of Speech Sounds. In Goldsmith, J. (ed.) 
The Handbook of Phonological Theory. Blackwell.Pp. 245-307.
Stevens, K. 1997. Articulatory-Acoustic-Auditory Relationships. In Hardcastle, W. and J. Laver (eds.) 
The Handbook of Phonetic Sciences. Blackwell. Pp. 462-507.
Ladefoged, P. 1997. Linguistic Phonetic Descriptions.  In Hardcastle, W. and J. Laver (eds.) The 
Handbook of Phonetic Sciences. Blackwell. Pp. 589-618.
Maddieson, I. 1997. Phonetic Universals.  In Hardcastle, W. and J. Laver (eds.) The Handbook of 
Phonetic Sciences. Blackwell. Pp. 619-639.

Greg Dogil: Spracherkennung I (HS4)

Termine:

  • Di 8.00-9.30, Raum 12.21
  • Do 8.00-9.30, Raum 12.21

Kommentar: In dem Seminar werden die Methoden der akustischen Analyse vermittelt.  Die gängigen Methoden der Sprachaufzeichnung und Sprachanalyse werden  mit Hilfe der am Institut vorhandenen Rechner eingeübt.

Teilnahmevoraussetzungen: Einführung in die Phonetik/Phonologie

Literatur:

Neppert + Petursson, 1986, Elemente einer akustischen Phonetik, Buske  Verlag: Hamburg. 
Lass N.J., 1996, Principles of Experimental Phonetics, Mosby: St. Louis  etc. 
Stevens, K. 1998. Acoustic Phonetics, MIT Press.

Stefan Evert, Anke Lüdeling: Lexikostatistik und Computermorphologie (HS2)

Termine: Di 11.30-13.00, Raum 12.21

Kommentar: Lexikostatistik bezeichnet die statistische Beschäftigung mit der Verteilung von Wörtern in Texten. Diese unterscheidet sich von anderen statistischen Verteilungen dadurch, daß die Anzahl der seltenen Ereignisse (= Wörter) sehr hoch ist. Daher müssen hier spezielle statistische Verfahren angewendet werden (LNRE-Modelle, für Large Number of Rare Events).

Wir wollen die Lexikostatistik auf zwei wichtige Gebiete anwenden: morphologische Produktivität und Information Retrieval

morphologische Produktivität: Für computerlinguistische Anwendungen werden immer bessere und immer umfangreichere Lexika benötigt. Da Wortbildung produktiv ist, ist es nicht möglich, einfach alle für eine Anwendung relevanten Wörter mit ihren Eigenschaften aufzulisten. Wir wollen morphologische Produktivität quantitativ definieren und verschiedene statistische Verfahren anwenden, um Produktivitätsraten für verschiedene Wortbildungsprozesse zu berechnen und zu vergleichen.

Information Retrieval: Im Information Retrieval geht es u.a. darum, besonders aussagekräftige Schlüsselwörter zu finden. Wir wollen unterschiedliche Maße für die Relevanz eines Begriffs anschauen und dabei herausfinden, inwieweit auch hier LNRE-Modelle zugrunde liegen.

Teilnahmevoraussetzungen: Einführung in die Morphologie, Formale Sprachen

Leistungsnachweis: Übungsaufgaben, aktive Mitarbeit

Literatur: Wir behandeln u.a. Auszüge aus:

Baayen, 'Word Frequency Distributions', to appear.
Baayen/Lieber, 'Productivity and English derivation: a corpus-based study', Linguistics 29 (1991), 
801-843.
Lüdeling/Evert/Heid, 'On measuring morphological productivity',KONVENS 2000, 57-61.
Baayen, 'Quantitative aspects of morphological productivity', Yearbook of Morphology 1992, 109-149.
Katz, 'Distribution of content words and phrases in text and language modelling', Natural Language 
Engineering 2(1), 1996, 15-59

Literatur wird im Seminar ausgegeben.

Kurs-Homepage


Stefan Evert: Werkzeuge für Korpuslinguisten (Ü2)

Termine: Mi 14.00-15.30, Raum 12.21 - Vorlesung

Kommentar: Der erste Teil des Kurses gibt eine Einführung in das Statistik-Programm ``R'' (eine frei erhältliche Reimplementierung von ``S'' und ``S-Plus''). R kombiniert zahlreiche statistische Standardfunktionen, Programmiersprache, und flexible Möglichkeiten zur grafischen Darstellung. Haupteinsatzgebiete für den Korpuslinguisten sind alle Arten statistischer Auswertung von Daten und die Erstellung von Plots.

Im Mittelpunkt der zweiten Semesterhälfte steht die IMS Corpus Workbench. Nach einer kurzen Einführung in die Aufbereitung und Verwaltung von CWB-Korpora konzentriert sich der Kurs auf das Stellen von Korpusanfragen
mit CQP und die Anbindung an Perl-Skripte. Die Syntax von CQP-Queries wird anhand zahlreicher Beispiele erläutert. Dabei wird besonderer Wert auf die neuen Funktionen der CWB-Version 3.0 gelegt, sowie auf die Optimierung von
Korpusanfragen.

Die Kursteilnehmer sollen sich aktiv und selbständig mit den behandelten Werkzeugen beschäftigen. Der erste Teil dieses Kurses vermittelt Hintergrundwissen für das HS Lexikostatistik und Computermorphologie.

Teilnahmevoraussetzungen: Grundkenntnisse in Korpuslinguistik und im Umgang mit UNIX

Leistungsnachweis: keiner

Literatur:

Spector, Phil (1994). An introduction to S and S-plus. Duxbury, Belmont CA. [unbezahlbar]
König et al (1999). CQP User's Manual. IMS, Stuttgart.

Literatur wird im Kurs ausgegeben.


Christian Fortman, Christian Rohrer: Syntax I (V2+Ü2)

Termine:

  • Mo 9.45-11.15, Raum 13.11
  • Do 15.45-17.15, Raum 13.11

Kommentar: Das Seminar bietet eine Einführung in die LFG.  Es sollen der Formalismus der LFG, ihre Repräsentationen und Regeln erarbeitet werden. Daneben werden die Besonderheiten der Syntax des
Deutschen erarbeitet. Textgrundlage ist das Seminarskript ``Deutsche Satzstruktur''.

Literatur:

Wöllstein-Leisten, A.; Heilmann, A.; Stepan, P.; Vikner, S.: Deutsche Satzstruktur : Grundlagen der 
syntaktischen Analyse, Tübingen: Stauffenburg, 1997.

Ulrich Heid, Christian Rohrer: Maschinelle Übersetzung I (HS2)

Termine: Do 9.45-11.15, Raum 12.21

Kommentar: Der Kurs führt in die Grundprobleme der maschinellen Übersetzung ein. Als Beispiel-Paradigma wird die transferbasierte Übersetzung auf funktionalen Strukturen der LFG (Lexikalisch-Funktionale Grammatik) ausführlich dargestellt.

Themenüberblick:

  • Aufgaben der maschinellen Übersetzung: Disambiguierung und Zuordnung von Teilstrukturen von Quell- und Zielsprache;
  • Kurze Wiederholung der für den Transferansatz nötigen LFG-Grundlagen;
  • Transfer auf F-Strukturen: der Projektionsansatz von [Kaplan et al. 1994];
  • Überblick über andere MÜ-Systeme und -Ansätze  (Transfer vs. Interlingua; Beispielbasierte Übersetzung, Statistische Übersetzung; bestehende MÜ-Systeme im Überblick)
  • Neue Ansätze zur Disambiguierung: KAYs Arbeiten zur `Triangulation'  (Nutzung von mehrsprachigen Parallelcorpora): mit eigenen Experimenten DE/EN vs. DE/FR.

Teilnahmevoraussetzungen: Syntax I (und idealerweise Syntax II): LFG

Leistungsnachweis: Klausur am Semesterende

Literatur: Wird in der ersten Sitzung angegeben


Ulrich Heid, Stefan Evert: Terminologie-Extraktion aus Texten (HS2)

Termine: Mi 9.45-11.15, Raum 12.21

Kommentar: BEREICH: Comp. Lexikographie

Diskussion neuerer Methoden zum Aufbau von Fachlexika aus Texten. Die Extraktion von Fachwortschatz (Terminologie) aus Textmaterial ist für Anwendungen im Dokumentations- und Übersetzungswesen relevant. Es
gibt bereits Werkzeuge für die Extraktion von monolingualen Lexikoneinträgen,während die Extraktion von Äquivalenzpaaren noch sehr stark ein Gegenstand der Forschung ist (Word-Alignment, Alignment von Wortsequenzen).

Ansätze zur Termkandidaten-Extraktion beruhen zum Teil auf statistischen Methoden, zum Teil auf linguistischen Extraktionsverfahren, die sich Eigenschaften der Wortstruktur und  der Syntax von Nominalgruppen von Termkandidaten zunutze machen.

Im Seminar werden die wichtigsten Ansätze vorgestellt, anhand neuerer Literatur diskutiert und anhand von Daten zum Deutschen  überprüft:

  • Überblick über den Bereich Terminologie und Fachwortschatz
  • Statistische Tests (chi square, t-test, etc.)
  • Extraktionsverfahren für Nominalgruppen (Basis Wortklassen- Chunk,...-Annotation)
  • Extraktion von Rohmaterial für den Aufbau von Definitionen der Fachausdrücke
  • Eigene Experimente

Zu Beginn des Seminars findet eine kompakte Auffrischung/Einführung zur Corpusabfrage mit CQP statt (mit Aufgaben).

Teilnahmevoraussetzungen: Softwarelabor 2; gute Kenntnis von CQP; ggf. Programmiersprache (Perl, C, Java)

Leistungsnachweis: [Auf Wunsch: Referat]

Literatur: Wird noch angegeben


Esther König-Baumer: Information Retrieval (HS2)

Termine: Mo 14.00-15.30, Raum 12.21

Kommentar: Fast jede WWW-BenutzerIn hat schon von Search Engines, also einer Art von Information-Retrieval- (IR) oder Text-Retrieval-Systemen Gebrauch gemacht. Dieses Seminar soll einen Überblick geben über

  • gängige Methoden und Begriffe des 'klassischen' Information Retrieval
  • verwandte Gebiete: Information Extraction, Information Filtering, Information Routing, Document Classification, Categorization, ...

Ein wichtiger Aspekt ist auch der Einsatz computerlinguistischer Methoden in Information-Retrieval-Systemen.

Teilnahmevoraussetzungen: Grundkenntnisse Informatik

Leistungsnachweis: Vortrag im Seminar mit ausgearbeitetem Handout

Literatur:

Frakes, W.; Baeza-Yates, R.: Information Retrieval. Data Structures and Algorithms, Prentice-Hall, N.J., 
1992
Norbert Fuhr: Information Retrieval. Manuskript. Universität Dortmund, 1996.
C. J. van Rijsbergen: Information Retrieval. 1979. (vergriffen)
Salton, G.; McGill,M.J.: Introduction to Modern Information Retrieval. McGraw-Hill, New York 1983. 

Esther König-Baumer : Deduktionssysteme (HS2)

Termine: Fr 14.00-15.30, Raum 12.21

Kommentar: Automatische Beweiser sind zentraler Bestandteil vieler Systeme aus dem Bereich der KI und stellen insbesondere für das logische Programmieren eine notwendige technische Voraussetzung dar. Im Seminar werden die Grundlagen für Deduktionssysteme verschiedenster Art behandelt. Die Themen umfassen u.a. Kalküle für Prädikatenlogik - insbesondere verschiedene Varianten der Resolutionsmethode, sowie Kalküle des natürlichen Schließens - und verschiedene Repräsentationsmethoden für solche Kalküle wie Tableaux, Connection-Graph-Methode, oder Matrix-Methode. Besonderes Augenmerk wird auf die Grundlagen für das gängige Paradigma des logisches
Programmierens, das Programmieren mit definiten Klauseln, gelegt. Ausserdem werden constraint-basierte Systeme besprochen.

Teilnahmevoraussetzungen: Grundkenntnisse Logik

Leistungsnachweis: Vortrag im Seminar mit ausgearbeitetem Handout

Literatur:

Hofbauer/Kutsche (1991). Grundlagen des maschinellen Beweisens, Vieweg, ISBN 3-528-14718-0 (2.Aufl.)

weitere Literatur wird bekannt gegeben


Wolfgang Lezius, Arne Fitschen: Wie halte ich einen Vortrag? Wie schreibe ich eine Ausarbeitung? (S2)

Termine: Do 11.30-13.00, Raum 12.21 - Seminar

Kommentar: In diesem Seminar möchten wir den Studenten die Möglichkeit geben, ohne den Druck eines Scheinerwerbs zu üben, wie ein guter Vortrag gehalten wird bzw. eine gute Ausarbeitung angefertigt wird. Dazu werden die grundsätzlichen Prinzipien und Richtlinien im Seminar vorgestellt und anschließend an einem konkreten Thema eingeübt. D.h., jeder Teinehmer erstellt eine Ausarbeitung und hält dazu einen Vortrag. Die Dozenten steuern eine 'Muster'ausarbeitung und einen 'Muster'vortrag bei, die im Plenum ausführlich diskutiert werden.

Ablaufplan:

  1. Wie schreibe ich eine Ausarbeitung?
    1. Richtlinien zur Erstellung
    2. Diskussion der Musterausarbeitung
  2. Wie halte ich einen Vortrag?
    1. Allgemeine Richtlinien
    2. Hinweise zu Folienvorträgen
    3. Hinweise zu PowerPoint(TM)-Vorträgen
    4. Vorträge der Studenten
    5. Diskussion des Mustervortrags

Teilnahmevoraussetzungen: Bereitschaft zum Anfertigen einer Ausarbeitung / Halten eines Vortrags

Leistungsnachweis: nicht vorgesehen


Anke Lüdeling: Einführung in die Morphologie (V2)

Termine: Mi 15.45-17.15, Raum 12.21

Kommentar: Die Morphologie hat einerseits eigene Gesetzmäßigkeiten und Prinzipien, weshalb sie oft als ein eigenes
'Modul' innerhalb einer Grammatiktheorie angesehen wird. Andererseits können viele morphologische Prozesse nicht unabhängig von phonologischer, lexikalisch-semantischer und/oder syntaktischer Information betrachtet werden. Zunächst werden morphologische Grundbegriffe wie Morphem, Allomorphie, Derivation, Komposition etc. vermittelt. Dann werden anhand ausgewählter Flexions- und Wortbildungsphänomene die Abängigkeiten von Morphologie und Syntax sowie von Morphologie und lexikalischer Semantik betrachtet.

Daneben ist die Morphologie für viele computerlinguistische Anwendungen Voraussetzung. Neben morphologischen Problemen der theoretischen Linguistik sollen deswegen auch computerlinguistische Ansätze und Modelle vorgestellt werden.

Teilnahmevoraussetzungen: Einführung in die Sprachwissenschaft

Leistungsnachweis: Übungsaufgaben, aktive Mitarbeit, evtl. Kurzreferat

Literatur: jeweils einige Kapitel aus:

Bauer, Lauri (1988): Introducing Linguistic Morphology. Edinburgh University Press, Edinburgh
Spencer Andrew (1991): Morphological Theory. Blackwell, Oxford
Spencer, Andrew + Zwicky, Arnold (1998): The Handbook ofMorphology. Blackwell, Oxford

Kurs-Homepage


Bernd Möbius: Laborphonologie des Deutschen (HS2)

Termine: Di 9.45-11.15, Raum 3.11 Phonetiklabor - Vorlesung/Übung

Kommentar: Es hat sich in den letzten Jahren immer deutlicher gezeigt, dass einige der klassischen phonologischen Regeln/Constraints einer Sprache in empirischer oder theoretischer Hinsicht stärker in die Nähe der Phonetik gerückt werden sollten. In empirischer Hinsicht können mit experimentalphonetischen und anderen Verfahren im Rahmen der
'Laboratory Phonology' neue Erkenntnisse gewonnen werden, die dort Klarheit zu schaffen in der Lage sind, wo die auditive Trankription oder die Sprecherintuition mit Unsicherheiten behaftet ist. In theoretischer Hinsicht hat sich gezeigt, dass einige Phänomene, die bisher als Manipulation von phonologischen Kategorien (Merkmale, metrische Konstituenten, usw.) analysiert wurden, sinnvoller als phonetisch-gradient zu analysieren sind (numerische Dauermodellierung, Interaktion artikulatorischer Gesten, usw.), ganz analog zu solchen Verfahren, die auch in der Sprachsynthese verwendet werden. In diesem Seminar machen wir uns anhand von Handbüchern und Artikeln zur Phonologie des Deutschen auf die Suche nach solchen (ganz und gar nicht seltenen) phonologischen Regeln, die von einer laborphonologischen Neubetrachtung profitieren können. Kleine phonetische Experimente werden gemeinsam konzipiert und durchgeführt, und es ergeben sich verschiedene Themen für Hausarbeiten, Studienarbeiten, usw.

Teilnahmevoraussetzungen: Absolviertes Grundstudiumsseminar 'Einf. Phonetik/Phonologie' oder äquivalente Kenntnisse.

Leistungsnachweis: Hausarbeit

Literatur:

Wiese, R. 1996. The Phonology of German. Oxford: OUP.

Weitere phonologische, phonetische und Interface-Literatur wird bereitgestellt


Bernd Möbius: Prosodie und Intonation (HS2)

Termine: Mo 9.45-11.15, Raum 12.21

Kommentar: Der Stand der Forschung auf dem Gebiet der Prosodie, insbesondere der Intonation, läßt sich als äußerst divers und kontrovers charakterisieren. Dies trifft sowohl auf die phonologische als auch auf die phonetische Beschreibungsebene zu. In diesem Seminar sollen die wichtigsten aktuellen Intonationsmodelle besprochen werden,
und zwar sowohl hinsichtlich ihrer phonologischen Grundlagen und Annahmen als auch unter dem Aspekt ihrer Implementierung und Anwendung in sprachverarbeitenden Systemen. Weiterhin soll die Prosodie aus Sicht der Sprachproduktion besprochen werden.

Je nach Vorkenntnissen der Teilnehmer soll zu Beginn des Seminars zunächst die prosodische Terminologie erarbeitet werden.

Teilnahmevoraussetzungen: Einführung in die Phonetik und Phonologie

Leistungsnachweis: Regelmäßige Teilnahme, Vortrag und schriftliche Ausarbeitung

Literatur:

1) D. Robert Ladd (1996): Intonational phonology. Cambridge Univ. Press.
2) Die Beiträge von Beckman, Grønnum, Ladd und Möbius in: Proc. 13th Internat. Congr. of Phonetic Sciences, 
   Vol. 1, Stockholm, 1995.
3) Bernd Möbius (1993): Ein quantitatives Modell der deutschen Intonation - Analyse und Synthese von 
   Grundfrequenzverläufen. Niemeyer, Tübingen. Kapitel 2-4.

Bernd Möbius: Sprachsynthese II (HS2)

Termine: Di 15.45-17.15, Raum 3.11 Phonetiklabor

Kommentar: Bei der Konversion von Text in Lautsprache (text-to-speech, TTS) lassen sich prinzipiell zwei Schritte unterscheiden, linguistische Analyse und akustische Sprachsynthese. Während das Seminar Sprachsynthese I den Schwerpunkt auf die akustische Synthese legte, sollen in Teil II die linguistischen Komponenten eines TTS-Systems im
Mittelpunkt stehen.

Die folgenden Probleme der linguistischen Textanalyse sollen besprochen werden: Erstellung des Lexikons einschließlich morphologischer Paradigmata, Kompositazerlegung und Analyse unbekannter Wörter, Disambiguierung, phonologische Prozesse und Ausspracheregeln. Die einzelnen Probleme sowie Methoden und Techniken zu ihrer Lösung sollen anhand kleiner praktischer Übungen veranschaulicht werden, und zwar unter Verwendung des TTS-Systems IMS-Festival. Bei Interesse können die Übungen auch in weiterführende Projekte (Studienarbeit, Diplom-/Magisterarbeit) münden.

Teilnahmevoraussetzungen: Voraussetzungen: Sprachsynthese I (empfohlen)

Leistungsnachweis: Regelmäßige Teilnahme, Übungsaufgabe oder Vortrag, jeweils mit schriftlicher Ausarbeitung

Literatur:

1) Richard Sproat (Hg.) (1998): Multilingual Text-to-Speech Synthesis. Kluwer, Dordrecht
2) Thierry Dutoit (1997): An Introduction to Text-to-Speech Synthesis. Kluwer, Dordrecht

Gregor Möhler: Entwicklung eines Dialogsystems mit VoiceXML (HS4)

Termine: Fr 11.30-13.00, Raum Phonetiklabor - am 27.4 erstes Treffen (weitere Termine flexibel)

Kommentar: Blockseminar (1 Woche) zu Beginn der Sommersemesterferien

Zielgruppe: Dipl. CL / Dipl.-Inf.

Mit der Einigung auf die gemeinsame Markup-Sprache VoiceXML im Mai 2000 haben die Entwickler von Sprachdialogsystemen und Stimmportalen (voice portals) die Voraussetzung für portierbare Dialogsysteme auf der
Grundlage der Internet-Technologie geschaffen. Im Zentrum des Seminars steht die praktische Entwicklung eines einfachen Dialogsystems auf der Basis des aktuellen VoiceXML-Standards. Die Realisierung des Systems mit Hilfe eines VoiceXML-fähigen Stimmportals ist während des Blockseminars in den Sommersemesterferien geplant. An den Terminen innerhalb des Semesters werden die notwendigen Grundlagen wie Methoden und Techniken des Dialogdesigns, Wizard-of-Oz Experimente, Grundlagen von VoiceXML sowie Aufbau und Komponenten eines Dialogsystems vermittelt.

Leistungsnachweis: Regelmäßige Teilnahme, Übungsaufgaben und Vortrag

Literatur:

1) Niels Ole Bernsen, Hans Dybkaer und Laila Dybkaer: Designing Interactive Speech Systems, From First 
   Ideas to User Testing, Springer, 1998
2) The VoiceXML Forum http://www.voicexml.org
3) The DISC-Project http://www.disc2.dk

Kurs-Homepage


Christine Nanz: Problematik der maschinellen Übersetzung des Japanischen und Koreanischen bezüglich der deutschen Sprache (HS2)

Termine: Do 8.00-9.30, Raum 17.53 (KII)

Kommentar: In diesem Seminar sollen die Grundlagen der Maschinellen Uebersetzung dargestellt und diskutiert werden. Den eigentlichen Schwerpunkt des Seminars bildet die Betrachtung verschiedener Ansaetze (z.B. Verbmobil oder LFG) bezueglich der Uebersetzung des Jap.und Korean. und umgekehrt. Aufgrund der so verschiedenen Sprachen wie es Deutsch und der Japanisch bzw. Koreanisch sind ergeben sich natuerlich interessante Problemstellungen.

Teilnahmevoraussetzungen: Kenntnisse des Japanischen bzw. Koreanischen werden nicht vorausgesetzt.

Leistungsnachweis: Scheinerwerb: Klausur oder Hausarbeit

Literatur: Literaturhinweise in der ersten Sitzung.


Peter Regel-Brietzmann: Spracherkennung III (HS2)

Kommentar: Blockseminar. Ende des Sommersemesters / 3.11

Das Seminar teilt sich in einen theoretischen Teil und einen praktischen Teil am Rechner. Der theoretische Teil enthält die Grundlagen der automatischen Spracherkennung. Den Schwerpunkt bilden die Hidden-Markov-Modelle. Außerdem sind Spezialthemen, die im praktischen Teil umgesetzt werden, Inhalt des Seminars. Der praktische Teil enthält eine Übung am Rechner, die den Umgang mit dem Hidden-Markov-Toolkit (HTK) und das Erarbeiten spezieller Probleme der Spracherkennung zum Ziel hat (z.B. optimale Wortuntereinheiten, Aussprachevarianten, Sprechererkennung).

Teilnahmevoraussetzungen: Grundlagen der Phonetik und Signalverarbeitung sind nützlich, aber nicht Voraussetzung

Leistungsnachweis: Seminararbeit

Literatur:

  • Kapitel aus N. Lass: Principles of Exp. Phonetics, Kapitel 11, 'Speech Recognition by Computers': Sehr gut geschrieben, umfassende Grundlagenvermittlung, engl.
  • Artikel aus Zeitschrift C't, 1993: 'His Master's Voice' Nicht mehr ganz neu, aber immer noch informativ, deutsch
  • Artikel aus Zeitschrift iX, 1999: 'HAL, hoerst du mich?'  Brandaktuell, aber nicht seht vertiefend.

Kopien Vorbereitender Literatur sind vor dem Blockseminar im Sekretariat erhältlich.


Uwe Reyle: Logik und formale Grundlagen II (V2+Ü2)

Termine:

  • Di 14.00-15.30, Raum 12.21
  • Do 14.00-15.30, Raum 12.21

Kommentar: Schwerpunkte des Seminars bilden (i) die Besprechung von formalen Beweiskalkülen der Prädikatenlogik, und (ii) eine Einführung in die Wahrscheinlickkeitstheorie. Zuletzt werden nicht-monotone
Inferenzverfahren besprochen.

Teilnahmevoraussetzungen: Logik und formale Grundlagen I


Antje Roßdeutscher: Infinite Verbformen (HS2)

Termine: Mi 14.00-15.30, Raum 17.23 - Vorlesung

Kommentar: In dem Seminar soll folgenden Fragen nachgegangen werden: Welche Bedeutung haben die verschiedenen Status eines Verbs?

3. Status                   1. Status                  2. Status
ge-heil-t                     heil-en                     zu heil-en
der geheilte Patient    die heilende Salbe    der zu heilende Patient

Macht es Sinn, davon zu sprechen, dass eine morphologische Markierung wie die des Perfekt einen einheitlichen semantischen Effekt hat? Wie laesst er sich charakterisieren? Wie verhaelt sich dies zu Veraenderungen in der Argumentstruktur? Gibt es einen einheitlichen semantischen Beitrag von `zu'-Infinitiven im Gegensatz zu den reinen Infinitiven? Wie verh'alt es sich hier mit der Argumentstruktur?

Welche Rolle spielen die Hilfsverben `sein', `werden', `haben', `bekommen'in Perfekt, Passiv, Futur? Welches sind Gemeinsamkeiten, welches die Unterschiede zu gleichlautenden Kopula-Verben?

Es sollen auch Unterschiede zum Englischen beruecksichtigt werden.

Teilnahmevoraussetzungen: Nuetzlich sind Vorkenntnisse ueber die Syntax-Semantik-Schnittstelle, wie sie etwa von Haider diskutiert werden.

Literatur:

Haider, Hubert. `Deutsche Syntax, Generativ', Narr Verlag, Tuebingen, 1993,
Rossdeutscher, Antje. `Lexikalisch gestuetzte formale Textinterpretation'. Habilitationschrift. Arbeitspapiere des
Sonderforschungsbereichs 340, Nr. 157.

Ulrich Schade: Einführung in die Computerlinguistik (V2+Ü2)

Termine:

  • Mi 14.00-15.30, Raum 13.11
  • Fr 9.45-11.15, Raum 13.11

Kommentar: Die Computerlinguistik beschäftigt sich mit Verarbeitungsmechanismen natürlicher Sprache. Ihr Ziel ist die Modellierung von Sprachverstehen auf dem Rechner. Hierzu werden für jede Analyse- und Repräsentationsebene (Phonetik/Phonologie, Morphologie, Lexikon, Syntax, Semantik, Pragmatik/Weltwissen) Module implementiert, die auf
Theorien der theoretischen Linguistik, der künstlichen Intelligenz und Wahrscheinlichkeitstheorie basieren. Ein zentrales Problem der Computerlinguistik ist dabei die Kommunikation der verschiedenen Module untereinander.

Der Kurs gibt einen Überblick über einige dieser Module und zielt darauf hin, ein kleines System zu implementieren, das Sätze analysieren, in semantische Repräsentationen überführen und aus diesen gewisse Schlüsse ziehen kann.

Teilnahmevoraussetzungen: Prolog

Literatur:

Gerald Gazdar and Chris Mellish. 'Natural Language Processing in PROLOG'. Addison Wesley, 1989

Ulrich Schade: Sprachproduktion (HS2)

Termine: Mi 8.00-9.30, Raum Phonetiklabor

Kommentar: Das Seminar Sprachproduktion wendet sich an Studierende, die sich einen Überblick über psycholinguistische Modellansätze zum kognitiven Prozess der Sprachproduktion verschaffen wollen.

Im Seminar werden grundlegende und aktuelle Originalarbeiten zur Sprachproduktion vorgestellt und diskutiert. Im Einzelnen werden die Teilprozesse Konzeptualisierung, Lexikalischer Zugriff, Grammatische Enkodierung und Phonologische Enkodierung behandelt. Das sogenannte Levelt-Modell dient dabei als Bezugsbasis für die einzelnen Ansätze.

Literatur:

Levelt, W.J.M. (1989): Speaking. Cambridge, MA: MIT Press, Kapitel 1.

Ulrich Schade: Versprecher und Reparaturen (HS2)

Termine: Di 14.00-15.30, Raum Phonetiklabor

Kommentar: Versprecher und Reparaturen bilden einen wichtigen Zugang  zu Erkenntnissen über Sprachverarbeitungsprozesse, da sie diversen Regelmäßigkeiten unterliegen, die sich nur erklären lassen, wenn man bestimmte Annahmen über die zugrundeliegenden Verarbeitungsprozesse macht.

In der Veranstaltung werden zunächst sowohl für die Versprecher als auch für deren Reparaturen Klassifikationsschemata erarbeitet. Danach wird es möglich sein, die angesprochenen Regelmäßigkeiten zu erkennen und zu beschreiben und so Restriktionen für die Verarbeitungsprozesse abzuleiten.

Literatur:

Nooteboom, S.G. (1973): The tongue slips into patterns. In V.A. Fromkin (Ed.), Speech Errors as Linguistic Evidence.
Den Haag: Mouton.

Michael Schiehlen: Algorithmische Semantik (V2+Ü2)

Termine:

  • Di 9.45-11.15, Raum 13.11
  • Do 14.00-15.30, Raum 13.11

Helmut Schmid: Parsing II: Statistische Methoden in NLP (V2+Ü2)

Termine:

  • Mo 11.30-13.00, Raum Rechnerpool - Übung
  • Fr 9.45-11.15, Raum 12.21 - Vorlesung

Kommentar: In den letzten Jahren haben statistische Verfahren in der maschinellen Sprachverarbeitung stark an Bedeutung gewonnen. Die Vorlesung stellt einige der wichtigsten dabei verwendeten Verfahren (u.a. Markowmodelle, probabilistische kontextfreie Grammatiken, Glättungsverfahren, Signifikanztests) vor und beschreibt praktische Anwendungen.

Teilnahmevoraussetzungen: Logik und formale Grundlagen I und II, Parsing I

Literatur:

Christopher Manning und Hinrich Schütze: Foundations of Statistical Natural Language Processing, MIT Press.

Eingeladene Vorträge: Institutskolloquium (V2)

Termine: Mo 15.45-17.15, Raum 12.21


Wolfgang Wokurek, et.al.: Softwarelabor II (PS4)

Termine:

  • Mo 14.00-17.15, Raum 3.38 und 3.11
  • Do 14.00-17.15, Raum 3.38 und 3.11

Kommentar: Zielgruppe: Diplomstudium Computerlinguistik; Alternative Studiengestaltung: 'technisches Fach' Diese Laborübung wird Studenten geisteswissenschaftlicher Studiengänge als Ergänzungslehrveranstaltung aus dem ingenieurwissenschaftlichen Bereich empfohlen.

Voraussetzung: Softwarelabor I

Dieses Labor führt in die praktische Verwendung des Computers in den  Gebieten Akustische Phonetik, Phonologie und Linguistik ein.

  • Sprachanalyse und Sprachsynthese
  • Automatische Spracherkennung
  • Multimediale Präsentation
  • Corpuserschließung I
  • Corpuserschließung II
  • Parsing I
  • Parsing II

Der erste Themenblock gibt eine Einführung in die akustische, phonetische und signaltechnische Aspekte der Sprachverarbeitung.  Daneben wird auch die Computergestützte Vorbereitung von Vortragsfolien geübt. Der zweite Themenblock Corpora zeigt die Verwendung der wichtigsten Werkzeuge zur Erstellung und zur Abfrage von Textkorpora. Im dritten Block werden Programme zur syntaktischen Analyse von Texten vorgestellt.

Leistungsnachweis: Laborprotokolle

Literatur: Skripten


Wolfgang Wokurek: Statistische Methoden (PS4)

Termine:

  • Mo 9.45-11.15, Raum 3.11
  • Do 9.45-11.15, Raum 3.11

Kommentar: Das Seminar führt in Grundbegriffe der Wahrscheinlichkeitstheorie, der Statistik und der Informationstheorie ein. Die methodische Grundlagen zur statistischen Bewertung von Experimenten werden vorgestellt und anhand von Beispielen mit Hilfe des Rechners geübt.

Teilnahmevoraussetzungen: Formale Methoden

Leistungsnachweis: Seminararbeit