Synchroner Wortverwendungsbezug (SURel)

Test- und Annotationsdaten für Bedeutungsdivergenzen zwischen SdeWaC- und COOK-Korpus

Synchroner Wortverwendungsbezug (SURel)

Typ

Datensatz

Autor

Anna Hätty, Dominik Schlechtweg, Sabine Schulte im Walde

Beschreibung

Diese Datensammlung enthält diachrone Bewertungen des semantischen Bezugs für deutsche Wortverwendungspaare aus der Allgemeinsprache sowie der domänenspezifischen Sprache des Kochens. Eine Beschreibung des Datenformats, Code zur Verarbeitung der Daten und weitere Datensätze finden Sie auf der WUGseite.

Zusätzliche Daten stellen wir unter misc/ zur Verfügung:

  • testset: ein Testsatz für semantische Bedeutungsverschiebung mit 22 deutschen Lexemen, mit unterschiedlichen Graden an Bedeutungsverschiebungen von der Allgemeinsprache hin zur domänenspezifischen Sprache des Kochens. Der 'Mean Relatedness Score' bezeichnet das annotationsbasierte Maß für Bedeutungsverschiebungen wie im Paper beschrieben. 'Frequenz GEN' und 'Frequenz SPEC' listen die Häufigkeiten der Zielwörter im allgemeinsprachlichen Korpus (GEN) und im domänenspezifischen Korpus (SPEC) auf. 'Übersetzungen' enthält englische Übersetzungen für mögliche Bedeutungen um die Bedeutungsverschiebung zu illustrieren. Beachten Sie, dass auch andere Bedeutungen exitieren können.
  • tables: die annotierte Tabelle für jeden Annotator.
  • plots: Plots zur Datenvisualisierung.


Weitere Informationen zu den bereitgestellten Daten entnehmen Sie bitte dem unten angegebenen Papier.

Referenzen

Anna Hätty, Dominik Schlechtweg, Sabine Schulte im Walde. 2019. SURel: A Gold Standard for Incorporating Meaning Shifts into Term Extraction. In Proceedings of the Eighth Joint Conference on Lexical and Computational Semantics (*SEM). Minneapolis, Minnesota, USA, 2019.

Download

Die Ressourcen sind frei verfügbar für Lehre, Forschung sowie andere nicht-kommerzielle Zwecke. Für weitere Informationen schreiben Sie bitte eine E-Mail an die Autoren.

Verwandte Ressourcen

  • WOCC: Korpora, aus denen die Verwendungspaare für die Annotation entnommen wurden.
  • DURel: parallel annotierter diachroner Datensatz.
  • WUGs: Wortverwendungsgraphen.
  • DURel Tool: semantisches Annotations-Tool für Satzpaare eines Wortes.
  • Metaphorischer Wandel: ähnlich annotierter diachroner Datensatz zu metaphorischem Bedeutungswandel.
Dieses Bild zeigt Dominik Schlechtweg
 

Dominik Schlechtweg

Ehemaliger Mitarbeiter

Dieses Bild zeigt Sabine Schulte im Walde
Apl. Prof. Dr.

Sabine Schulte im Walde

Akademische Rätin

Zum Seitenanfang