Synchroner Wortverwendungsbezug (SURel)

Test- und Annotationsdaten für Bedeutungsdivergenzen zwischen SdeWaC- und COOK-Korpus

Synchroner Wortverwendungsbezug (SURel)

Typ

Datensatz

Autor

Anna Hätty, Dominik Schlechtweg, Sabine Schulte im Walde

Beschreibung

Diese Datensammlung enthält diachrone Bewertungen des semantischen Bezugs für deutsche Wortverwendungspaare aus der Allgemeinsprache sowie der domänenspezifischen Sprache des Kochens. Eine Beschreibung des Datenformats, Code zur Verarbeitung der Daten und weitere Datensätze finden Sie auf der WUGseite.

  • testset: ein Testsatz für semantische Bedeutungsverschiebung mit 22 deutschen Lexemen, mit unterschiedlichen Graden an Bedeutungsverschiebungen von der Allgemeinsprache hin zur domänenspezifischen Sprache des Kochens. Der 'Mean Relatedness Score' bezeichnet das annotationsbasierte Maß für Bedeutungsverschiebungen wie im Paper beschrieben. 'Frequenz GEN' und 'Frequenz SPEC' listen die Häufigkeiten der Zielwörter im allgemeinsprachlichen Korpus (GEN) und im domänenspezifischen Korpus (SPEC) auf. 'Übersetzungen' enthält englische Übersetzungen für mögliche Bedeutungen um die Bedeutungsverschiebung zu illustrieren. Beachten Sie, dass auch andere Bedeutungen exitieren können.
  • tables: die annotierte Tabelle für jeden Annotator.
  • plots: Plots zur Datenvisualisierung.


Zusätzliche Daten stellen wir unter misc/ zur Verfügung. Weitere Informationen zu den bereitgestellten Daten entnehmen Sie bitte dem unten angegebenen Papier.

Referenzen

Anna Hätty, Dominik Schlechtweg, Sabine Schulte im Walde. 2019. SURel: A Gold Standard for Incorporating Meaning Shifts into Term Extraction. In Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (*SEM). Minneapolis, Minnesota, USA, 2019.

Download

Die Ressourcen sind frei verfügbar.

Verwandte Ressourcen
  • WOCC: Korpora, aus denen die Verwendungspaare für die Annotation entnommen wurden.
  • DURel: parallel annotierter diachroner Datensatz.
  • WUGs: Wortverwendungsgraphen.
  • DURel Tool: semantisches Annotations-Tool für Satzpaare eines Wortes.
  • Metaphorischer Wandel: ähnlich annotierter diachroner Datensatz zu metaphorischem Bedeutungswandel.

Dominik Schlechtweg

Dr.

Mitarbeiter

Dieses Bild zeigt Sabine Schulte im Walde

Sabine Schulte im Walde

Prof. Dr.

Akademische Rätin

Zum Seitenanfang