Abteilung Grundlagen der Computerlinguistik

Abteilung Grundlagen der Computerlinguistik, Leiter Prof. Dr. Jonas Kuhn

Willkommen am Lehrstuhl für Grundlagen der Computerlinguistik am IMS der Universität Stuttgart. Seit Januar 2010 wird die Gruppe von Prof. Jonas Kuhn geleitet.

Unsere Gruppe arbeitet an Berechnungsmodellen für die Verarbeitung natürlicher Sprache unter Verwendung regelbasierter und statistischer Techniken.

Team

Forschungsinteressen der Gruppenmitglieder

Statistische Modelle für das Parsing von Abhängigkeiten, die sich auf morphologisch reiche Sprachen konzentrieren. Unsere Forschung konzentriert sich insbesondere auf die Interaktion zwischen Morphologie und Syntax. Unsere Gruppe erzielte die besten Ergebnisse bei den beiden jüngsten gemeinsamen Aufgaben zum Parsen von morphologisch reichen Sprachen (SPMRL 2013 und SPMRL 2014). Wir sind auch an der Anpassung der universellen Abhängigkeiten an die deutsche Sprache beteiligt.

Ausgewählte Publikationen:

Algorithmische und theoretische Herausforderungen Informationsstruktur und Koreferenz. Wir entwickeln neuartige Algorithmen zur automatischen Lösung dieser Aufgaben, entwickeln Annotationsschemata und führen Annotationsaufgaben durch. Von besonderem Interesse ist die Interaktion zwischen Informationsstruktur und Prosodie, sowohl auf der Modellierungs- als auch auf der Berechnungsseite.

Ausgewählte Publikationen:

Algorithmische und architektonische Aspekte der datengesteuerten Erzeugung. Insbesondere die Interaktion zwischen referenzierender Expressionsgenerierung und Oberflächenrealisierung für End-to-End-Erzeugungssysteme und morphologisch reiche Sprachen (z.B. Deutsch). In jüngerer Zeit schwach überwachtes Lernen von Darstellungen für die Daten-zu-Text-Generierung und das semantische Parsen.

Ausgewählte Publikationen:

In Fortführung einer langen Tradition der Arbeit an korporativen und sprachtechnologischen Instrumenten am IMS ist unsere Gruppe an Projekten beteiligt, die sich auf infrastrukturelle Aspekte und die Nachhaltigkeit von Sprachressourcen konzentrieren. Dazu gehören die Erstellung von schlüsselfertigen Toolketten und Webservices, der einfache Zugriff auf Daten mittels Visualisierungs- und Abfragewerkzeugen, die Erstellung von Metadaten und die Dokumentation von Workflows für alle Arten von Sprachressourcen sowie die Unterstützung kollaborativer Annotations- und Kurationstätigkeiten. Die Gruppe betreibt auch das Stuttgarter CLARIN-D-Zentrum.

Ausgewählte Publikationen:

Wir arbeiten mit verschiedenen geisteswissenschaftlichen Disziplinen zusammen und entwickeln einen gemeinsamen methodischen Rahmen für die Analyse großer Textkorpora anhand spezifischer inhaltlich-analytischer Fragestellungen. Eines unserer Ziele ist es, die aggregierten Ergebnisse solcher Analysen für Geisteswissenschaftler transparent zu machen, was anpassungsfähige Modelle und interaktive Werkzeuge und Benutzeroberflächen erfordert. Wir haben an mehreren DH-bezogenen Projekten mitgewirkt: CLARIN-D, e-Identity, ePoetics, und wir sind an einem neuen Stuttgarter Zentrum für reflektierte Textanalytik (CRETA) in den digitalen Geisteswissenschaften beteiligt.

Ausgewählte Publikationen:

  • Andre Blessing, Andrea Glaser, and Jonas Kuhn. Biographical Data Exploration as a Test-bed for a Multi-view, Multi-method Approach in the Digital Humanities. Proceedings of the first Conference on Biographical Data in a Digital World, 2015.
  • Andre Blessing, Fritz Kliche, Ulrich Heid, Cathleen Kantner, and Jonas Kuhn. Computerlinguistische Werkzeuge zur Erschließung und Exploration großer Textsammlungen aus der Perspektive fachspezifischer Theorie. Grenzen und Möglichkeiten der Digital Humanities Sonderband 1, 2015.
  • Jonas Kuhn and Nils Reiter. A Plea for a Method-driven Agenda in the Digital Humanities. Global Digital Humanities Conference, Sydney, Australia. 2015.
  • Markus John, Steffen Koch, Florian Heimerl, Andreas Müller, Thomas Ertl, and Jonas Kuhn. Interactive Visual Analysis Of German Poetics. Global Digital Humanities Conference, 2015.
  • Nils Reiter. Towards Annotating Narrative Segments. Proceedings of the 9th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH), 2015.
  • Schulz, S. & Keller, M. (2016). Code-Switching Ubique Est - Language Identification and Part-of-Speech Tagging for Historical Mixed Text. LaTeCH@ACL, August, Berlin: The Association for Computer Linguistics.

In Fortführung einer langen Tradition am IMS liegt ein Schwerpunkt unserer Gruppe auf der Diskursrepräsentationstheorie, der Syntax-Semantik-Schnittstelle und der Rolle lexikalischer Informationen in der Wortbildung und der Satz-/Diskurs-Semantik.

Ausgewählte Publikationen:

Projekte

Digital Humanities:

Infrastruktur:

Digital Humanities:

  • e-Identity
    A collaboration between Political Science and Natural Language Processing
    PI: Prof. Dr. Cathleen Kantner, Co-PI at IMS: Prof. Dr. Jonas Kuhn
    further collaborators: University of Hildesheim and University of Potsdam
  • ePoetics
    A collaboration between Literary Studies, Computer Science and Natural Language Processing
    PI: Prof. Dr. Sandra Richter, Prof. Dr. Thomas Ertl, Prof. Dr. Jonas Kuhn, Prof. Dr. Andrea Rapp
  • DebateExplorer
    PI: Jonas Kuhn

SFB 732 Incremental Specification in Context

Abteilung Grundlagen der Computerlinguistik

Jonas Kuhn
Prof. Dr.

Jonas Kuhn

Lehrstuhl Grundlagen der Computerlinguistik, Geschäftführender Direktor des IMS

 

Sybille Laderer

Sekretariat Grundlagen der Computerlinguistik / Computerlinguistik (Juniorprofessur)

 

Barbara Schäfer

Projektsekretariat

Zum Seitenanfang