NRS EN/SV: Automatisch erkannte nicht erfasste Wortbedeutungen für Englisch und Schwedisch
- Typ
-
Datensatz
- Autor
-
Jonathan Lautenschlager, Emma Sköldberg, Simon Hengchen, Dominik Schlechtweg
- Beschreibung
-
Diese Datensammlung enthält englische und schwedische Wortverwendung-Bedeutungdefinitions-Instanzen, die mit binären Labels annotiert sind. Die Annotatoren wurden gebeten zu beurteilen, ob die jeweilige Bedeutungsdefinition die Bedeutung des Zielwortes in der jeweiligen Verwendung gut beschreibt. Wir stellen die folgenden Dateien zur Verfügung:
data/
: Wortverwendungen, Bedeutungsdefinitionen, Instanzen und Annotationen für zufällig ausgewählte Verwendungen (Phase 1) und für Verwendungen, die als fehlend im jeweiligen Wörterbuch vorhergesagt wurden (Phase 2). Die Instanzen für Phase 2 fehlen, können aber leicht rekonstruiert werden, indem jede Verwendung mit jeder Bedeutungsdefinitionen des Lemmas für diese Verwendung kombiniert wird. Darüber hinaus stellen wir mindestens einer Bedeutung zugewiesene und keiner Bedeutung zugewiesene Verwendungen zur Verfügung, die über die drei Annotatoren aggregiert wurden wie in der unten genannten Veröffentlichung beschrieben. Das für das Annotatorentraining verwendete Tutorial ist im annotation_standardization repository verfügbar.guidelines/
: die für das Annotatorentraining verwendeten Richtlinien.
Weitere Informationen, einschließlich der Einschränkungen der Daten, finden Sie in der unten genannten Veröffentlichung.
Version: 1.0.0, 27.02.2024.
- Referenz
-
Jonathan Lautenschlager, Emma Sköldberg, Simon Hengchen, Dominik Schlechtweg. 2024. Detection of non-recorded word senses in English and Swedish.
- Download
-
Die Ressource Ist per Download verfügbar.

Dominik Schlechtweg
Dr.Nachwuchsgruppenleiter