Position innerhalb des Seitenbaumes

Clarifying Insertions from Revision Edits (CLAIRE)

Datensatz für SemEval-2022 Task 7: Identifying Plausible Clarifications of Implicit and Underspecified Phrases in Instructional Texts

Typ: Datensatz
Autor*innen: Talita Anthonio, Anna Sauer, Michael Roth
Beschreibung: Datensatz zu SemEval 2022 Aufgabe 7: Identifying Plausible Clarifications of Implicit and Underspecified Phrases in Instructional Texts

Ziel der SemEval-Aufgabe war es, zwischen plausiblen und unplausiblen Revisionen für unklare oder uneindeutige Stellen in Anleitungstexte zu unterscheiden.

Der Datensatz enthält einzelne Sätze aus Anleitungstexten auf wikiHow, einer Plattform für kollaborativ editierte How-To-Guides. Jeder Satz ist mit fünf verschiedenen möglichen Revisionen verknüpft, die potentiell zuvor implizite oder unterspezifizierte Informationen einfügen und dadurch klarer werden lassen. Für diese Revisionen wird hier der Begriff clarifications (dt. Klärungen, Erläuterungen) verwendet.

Für jede der fünf möglichen Revisionen wurden Annotationen gesammelt, ob die jeweilige Einfügung im Kontext plausibel ist oder nicht. Diese Annotationen liegen als kontinuierlicher Wert zwischen 1 (sehr unplausibel) und 5 (sehr plausibel) und als Klassenlabel (unplausibel, neutral, plausibel) vor.
Referenz
Download: https://github.com/acidAnn/claire