Automatisch erkannte nicht erfasste Wortbedeutungen für Englisch und Schwedisch (NRS EN/SV)

Diese Datensammlung enthält englische und schwedische Wortbedeutungsannotationen, aus denen nicht erfasste Wortbedeutungen abgeleitet werden können.

NRS EN/SV: Automatisch erkannte nicht erfasste Wortbedeutungen für Englisch und Schwedisch

Typ

Datensatz

Autor

Jonathan Lautenschlager, Emma Sköldberg, Simon Hengchen, Dominik Schlechtweg

Beschreibung

Diese Datensammlung enthält englische und schwedische Wortverwendung-Bedeutungdefinitions-Instanzen, die mit binären Labels annotiert sind. Die Annotatoren wurden gebeten zu beurteilen, ob die jeweilige Bedeutungsdefinition die Bedeutung des Zielwortes in der jeweiligen Verwendung gut beschreibt. Wir stellen die folgenden Dateien zur Verfügung:

  • data/: Wortverwendungen, Bedeutungsdefinitionen, Instanzen und Annotationen für zufällig ausgewählte Verwendungen (Phase 1) und für Verwendungen, die als fehlend im jeweiligen Wörterbuch vorhergesagt wurden (Phase 2). Die Instanzen für Phase 2 fehlen, können aber leicht rekonstruiert werden, indem jede Verwendung mit jeder Bedeutungsdefinitionen des Lemmas für diese Verwendung kombiniert wird. Darüber hinaus stellen wir mindestens einer Bedeutung zugewiesene und keiner Bedeutung zugewiesene Verwendungen zur Verfügung, die über die drei Annotatoren aggregiert wurden wie in der unten genannten Veröffentlichung beschrieben. Das für das Annotatorentraining verwendete Tutorial ist im annotation_standardization repository verfügbar.
  • guidelines/: die für das Annotatorentraining verwendeten Richtlinien.

Weitere Informationen, einschließlich der Einschränkungen der Daten, finden Sie in der unten genannten Veröffentlichung.

Version: 1.0.0, 27.02.2024.

Referenz

Jonathan Lautenschlager, Emma Sköldberg, Simon Hengchen, Dominik Schlechtweg. 2024. Detection of non-recorded word senses in English and Swedish.

Download

Die Ressource Ist per Download verfügbar.

Dominik Schlechtweg

Dr.

Mitarbeiter

Zum Seitenanfang