Uni Stuttgart
---  Home ---  Events
---  Lehre ---  Jobs
---  Forschung ---  Kontakt
---  Resourcen ---  CorpLex
---  Suche

[Unilogo]

 Universität Stuttgart 
 Institut für Maschinelle Sprachverarbeitung 
 HS Terminologie-Extraktion aus Texten (SS 2001) 
 
 

Dozenten

  • Ulrich Heid
  • Stefan Evert

Termin

Mittwochs, 09:45 - 11:15, M12.21

Themenplan

25.04. UH Überblick über das Seminar: Ziele, Methoden, Kontext.
02.05. UH Was ist Terminologie? Was ist ein Terminus?
Modelle der Terminologiearbeit - Fachwortschatz - Typen von Termen
09.05. SE Einfache Verfahren zur Extraktion von Einworttermen aus Texten:
Frequenzverhältnisse nach K. Ahmad und Abgleich gegen bestehende Termdatenbanken.
16.05. SE Einführung in die Arbeit mit der IMS Corpus Workbench und CQP (Teil 1)
23.05. UH
SE
8:30 - 10:00 Einführung in die Arbeit mit CQP (Teil 3):
Extraktion Termkandidaten aus Texten: einfache Suchmuster auf Wortklassen-Ebene.
30.05. FÄLLT AUS
06.06. SE
UH
8:30 - 10:00 Einführung in die Arbeit mit CQP (Teil 3):
Suche in Nominal-Chunks und Anwendung zur Extraktion von Termkandidaten aus Fachtexten.
13.06. UH Definitionsrelevante Kontexte:
Experimente zur Suche nach "Wissensbausteinen" in Texten (z.B. Arbeiten von Pearson, Meyer usw.)
20.06. SE
UH
Realisierung eines integrierten Termextraktions-Systems am Beispiel niederländischer Sozialrechtsterminologie.
Korpusaufbereitung - Extraktion von Kandidaten - Abgleich gegen Zeitungstexte - Aufbau einer Datenbank von Termkandidaten
27.06. SE Statistische Tests als Hilfsmittel für die Termkandidaten-Extraktion: Einwortterme, Mehrwortterme und Kollokationen.
04.07. SE Methoden aus dem Information Retrieval: (inverse) Dokumentfrequenz und der Ansatz von Justeson/Katz.
11.07. UH Diskussion von Beispielen zu Pattern-basierten und "integrierten" Ansätzen der Termkandidaten-Extraktion.
18.07. UH Schlußsitzung: Ergebnisse, offene Fragen, Forschungsbedarf.

Literatur

Literatur wird noch bekanntgegeben.

Stefan Evert, Thu Apr 26 09:41:24 2001 (evert@ims.uni-stuttgart.de)