Abteilung Grundlagen der Computerlinguistik

Abteilung Grundlagen der Computerlinguistik, Leiter Prof. Dr. Jonas Kuhn

Willkommen am Lehrstuhl für Grundlagen der Computerlinguistik am IMS der Universität Stuttgart. Seit Januar 2010 wird die Gruppe von Prof. Jonas Kuhn geleitet.

Unsere Gruppe arbeitet an Berechnungsmodellen für die Verarbeitung natürlicher Sprache unter Verwendung regelbasierter und statistischer Techniken.

Derzeitige Forschungsprojekte:

  • DFG-Projekt MARDY (“Modeling Argumentation Dynamics in Political Discourse”). Interdisziplinäres Projekt im DFG-Schwerpunktprogramms 1999 Robust Argumentation Machines (RATIO), Förderung in beiden Phasen
    • Projektleitung: Sebastian Haunss, Bremen/Jonas Kuhn und Sebastian Padó, Stuttgart
  • terra incognita-Projekt Optimale Kommunikation: Experimentalforschung in Kombination mit Simulation und Computerlinguistik
    • Projektleitung: Prof. André Bächtiger, Institut für Sozialwissenschaften. Projektpartner: Gregor Betz, KIT; Raphael H. Heiberger Institut für Sozialwissenschaften, Universität Stuttgart; Prof. Jonas Kuhn und Sebastian Pado, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart
  • Knowledge-Language Interaction, IBM AI Horizons Network
    • Projektleitung: Jonas Kuhn, Sebastian Padó, Ngoc Thang Vu)
  • Projekt SDC4Lit (Science Data Center für Literatur)
    • Projektleitung: Roland Kamzelak, Deutsches Literaturarchiv Marbach, Ko-Projektleitung Michael Resch, Höchstleistungsrechenzentrum Stuttgart, Jonas Kuhn, IMS Stuttgart, Gabriel Viehhauser, Digital Humanities, Universität Stuttgart
  • Projekt XSample („Text Mining auf geschützten Werken durch Auszüge transparent erschließen“), Förderung durch das Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg im Rahmen des Programms „Wissenschaftliche Bibliotheken gestalten den digitalen Wandel (BW-BigDIWA)“
    • Projektleitung: Helge Steenweg, Universitätsbibliothek Stuttgart/Jonas Kuhn, Computerlinguistik/Thomas Dreier, Zentrum für Angewandte Rechtswissenschaft, KIT Karlsruhe)
  • textklang: Mixed-methods-Analyse von Lyrik in Text und Ton 
    • Universität Stuttgart: Prof. Dr. Jonas Kuhn, Prof. Dr. Gabriel Viehhauser, Prof. Dr. Ngoc Thang Vu
    • Deutsches Literaturarchiv Marbach (DLA): Prof. Dr. Sandra Richter, Dr. Anna Kinder, Dr. Gunilla Eschenbach
  • Ab November 2021: DFG-Projekt CAUTION („Computer-aided Analysis of Unreliability and Truth in Fiction – Interconnecting and Operationalizing Narratology“)
    • Projektleitung: Janina Jacke, Göttingen/Jonas Kuhn, Stuttgart

 

Abgeschlossene Projekte (Auswahl)

  • 2010 – 2020 Infrastrukturprojekt CLARIN-D (Common language resource infrastructure): Förderung durch BMBF/MWK Baden-Württemberg
  • 2016 – 2018 “RePlay-DH” zum Forschungsdatenmanagement für die Digital Humanities
    • Projektleitung: Dr. H. Steenweg (Univ.-Bib. Stuttgart), Prof. J. Kuhn (IMS Uni Stuttgart), Prof. S. Wesner (Universität Ulm); Förderung durch MWK Baden-Württemberg
  • 2016 “DebateExplorer”-Projekt mit der Wissenschaftsjournalistin Eva Wolfangel (gefördert im Rahmen der Datenjournalismus- Förderlinie der Volkswagen-Stiftung)
  • 2010 – 2018 DFG-SFB 732 “Inkrementelle Spezifikation im Kontext”
 (2015-18 Sprecher)
  • 2013 – 2016 eHumanities-Projekts “ePoetics”
    • Projektleitung: Professorin Dr. Sandra Richter, Neuere Deutsche Literatur, Universität Stuttgart; Förderung durch das BMBF
  • 2012 – 2015 eHumanities-Projekts “e-Identity”
    • Projektleitung: Professorin Dr. Cathleen Kantner, Politikwissenschaft, Universität; Förderung durch das BMBF

 

Team

Forschungsinteressen der Gruppenmitglieder

Statistische Modelle für das Parsing von Abhängigkeiten, die sich auf morphologisch reiche Sprachen konzentrieren. Unsere Forschung konzentriert sich insbesondere auf die Interaktion zwischen Morphologie und Syntax. Unsere Gruppe erzielte die besten Ergebnisse bei den beiden jüngsten gemeinsamen Aufgaben zum Parsen von morphologisch reichen Sprachen (SPMRL 2013 und SPMRL 2014). Wir sind auch an der Anpassung der universellen Abhängigkeiten an die deutsche Sprache beteiligt.

Ausgewählte Publikationen:

Algorithmische und theoretische Herausforderungen Informationsstruktur und Koreferenz. Wir entwickeln neuartige Algorithmen zur automatischen Lösung dieser Aufgaben, entwickeln Annotationsschemata und führen Annotationsaufgaben durch. Von besonderem Interesse ist die Interaktion zwischen Informationsstruktur und Prosodie, sowohl auf der Modellierungs- als auch auf der Berechnungsseite.

Ausgewählte Publikationen:

Algorithmische und architektonische Aspekte der datengesteuerten Erzeugung. Insbesondere die Interaktion zwischen referenzierender Expressionsgenerierung und Oberflächenrealisierung für End-to-End-Erzeugungssysteme und morphologisch reiche Sprachen (z.B. Deutsch). In jüngerer Zeit schwach überwachtes Lernen von Darstellungen für die Daten-zu-Text-Generierung und das semantische Parsen.

Ausgewählte Publikationen:

In Fortführung einer langen Tradition der Arbeit an korporativen und sprachtechnologischen Instrumenten am IMS ist unsere Gruppe an Projekten beteiligt, die sich auf infrastrukturelle Aspekte und die Nachhaltigkeit von Sprachressourcen konzentrieren. Dazu gehören die Erstellung von schlüsselfertigen Toolketten und Webservices, der einfache Zugriff auf Daten mittels Visualisierungs- und Abfragewerkzeugen, die Erstellung von Metadaten und die Dokumentation von Workflows für alle Arten von Sprachressourcen sowie die Unterstützung kollaborativer Annotations- und Kurationstätigkeiten. Die Gruppe betreibt auch das Stuttgarter CLARIN-D-Zentrum.

Ausgewählte Publikationen:

Wir arbeiten mit verschiedenen geisteswissenschaftlichen Disziplinen zusammen und entwickeln einen gemeinsamen methodischen Rahmen für die Analyse großer Textkorpora anhand spezifischer inhaltlich-analytischer Fragestellungen. Eines unserer Ziele ist es, die aggregierten Ergebnisse solcher Analysen für Geisteswissenschaftler transparent zu machen, was anpassungsfähige Modelle und interaktive Werkzeuge und Benutzeroberflächen erfordert. Wir haben an mehreren DH-bezogenen Projekten mitgewirkt: CLARIN-D, e-Identity, ePoetics, und wir sind an einem neuen Stuttgarter Zentrum für reflektierte Textanalytik (CRETA) in den digitalen Geisteswissenschaften beteiligt.

Ausgewählte Publikationen:

  • Andre Blessing, Andrea Glaser, and Jonas Kuhn. Biographical Data Exploration as a Test-bed for a Multi-view, Multi-method Approach in the Digital Humanities. Proceedings of the first Conference on Biographical Data in a Digital World, 2015.
  • Andre Blessing, Fritz Kliche, Ulrich Heid, Cathleen Kantner, and Jonas Kuhn. Computerlinguistische Werkzeuge zur Erschließung und Exploration großer Textsammlungen aus der Perspektive fachspezifischer Theorie. Grenzen und Möglichkeiten der Digital Humanities Sonderband 1, 2015.
  • Jonas Kuhn and Nils Reiter. A Plea for a Method-driven Agenda in the Digital Humanities. Global Digital Humanities Conference, Sydney, Australia. 2015.
  • Markus John, Steffen Koch, Florian Heimerl, Andreas Müller, Thomas Ertl, and Jonas Kuhn. Interactive Visual Analysis Of German Poetics. Global Digital Humanities Conference, 2015.
  • Nils Reiter. Towards Annotating Narrative Segments. Proceedings of the 9th SIGHUM Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH), 2015.
  • Schulz, S. & Keller, M. (2016). Code-Switching Ubique Est - Language Identification and Part-of-Speech Tagging for Historical Mixed Text. LaTeCH@ACL, August, Berlin: The Association for Computer Linguistics.

In Fortführung einer langen Tradition am IMS liegt ein Schwerpunkt unserer Gruppe auf der Diskursrepräsentationstheorie, der Syntax-Semantik-Schnittstelle und der Rolle lexikalischer Informationen in der Wortbildung und der Satz-/Diskurs-Semantik.

Ausgewählte Publikationen:

Projekte

Aktuelle Projekte

Digital Humanities:

Infrastruktur:

Abgeschlossene Projekte

Digital Humanities:

  • e-Identity
    A collaboration between Political Science and Natural Language Processing
    PI: Prof. Dr. Cathleen Kantner, Co-PI at IMS: Prof. Dr. Jonas Kuhn
    further collaborators: University of Hildesheim and University of Potsdam
  • ePoetics
    A collaboration between Literary Studies, Computer Science and Natural Language Processing
    PI: Prof. Dr. Sandra Richter, Prof. Dr. Thomas Ertl, Prof. Dr. Jonas Kuhn, Prof. Dr. Andrea Rapp
  • DebateExplorer
    PI: Jonas Kuhn

SFB 732 Incremental Specification in Context

Verbundene Gruppen

Abteilung Grundlagen der Computerlinguistik

Dieses Bild zeigt Jonas Kuhn
Prof. Dr.

Jonas Kuhn

Lehrstuhl Grundlagen der Computerlinguistik

 

Sybille Laderer

Sekretariat Grundlagen der Computerlinguistik / Computerlinguistik (Juniorprofessur)

Zum Seitenanfang