Daten zu SemEval-2022 Aufgabe 7
- Typ
-
Datensatz
- Autor*innen
-
Talita Anthonio, Anna Sauer, Michael Roth
- Beschreibung
-
Datensatz zu SemEval 2022 Aufgabe 7: Identifying Plausible Clarifications of Implicit and Underspecified Phrases in Instructional Texts
Ziel der SemEval-Aufgabe war es, zwischen plausiblen und unplausiblen Revisionen für unklare oder uneindeutige Stellen in Anleitungstexte zu unterscheiden.
Der Datensatz enthält einzelne Sätze aus Anleitungstexten auf wikiHow, einer Plattform für kollaborativ editierte How-To-Guides. Jeder Satz ist mit fünf verschiedenen möglichen Revisionen verknüpft, die potentiell zuvor implizite oder unterspezifizierte Informationen einfügen und dadurch klarer werden lassen. Für diese Revisionen wird hier der Begriff clarifications (dt. Klärungen, Erläuterungen) verwendet.
Für jede der fünf möglichen Revisionen wurden Annotationen gesammelt, ob die jeweilige Einfügung im Kontext plausibel ist oder nicht. Diese Annotationen liegen als kontinuierlicher Wert zwischen 1 (sehr unplausibel) und 5 (sehr plausibel) und als Klassenlabel (unplausibel, neutral, plausibel) vor.
- Referenz
- Download
Michael Roth
Dr.Emmy Noether-Gruppenleiter
Talita Rani Anthonio
Ehemalige Doktorandin
Anna Sauer
Ehemalige Doktorandin