Clarifying Insertions from Revision Edits (CLAIRE)

Datensatz für SemEval-2022 Task 7: Identifying Plausible Clarifications of Implicit and Underspecified Phrases in Instructional Texts

Daten zu SemEval-2022 Aufgabe 7

Typ

Datensatz

Autor*innen

Talita Anthonio, Anna Sauer, Michael Roth

Beschreibung

Datensatz zu SemEval 2022 Aufgabe 7: Identifying Plausible Clarifications of Implicit and Underspecified Phrases in Instructional Texts

Ziel der SemEval-Aufgabe war es, zwischen plausiblen und unplausiblen Revisionen für unklare oder uneindeutige Stellen in Anleitungstexte zu unterscheiden.

Der Datensatz enthält einzelne Sätze aus Anleitungstexten auf wikiHow, einer Plattform für kollaborativ editierte How-To-Guides. Jeder Satz ist mit fünf verschiedenen möglichen Revisionen verknüpft, die potentiell zuvor implizite oder unterspezifizierte Informationen einfügen und dadurch klarer werden lassen. Für diese Revisionen wird hier der Begriff clarifications (dt. Klärungen, Erläuterungen) verwendet.

Für jede der fünf möglichen Revisionen wurden Annotationen gesammelt, ob die jeweilige Einfügung im Kontext plausibel ist oder nicht. Diese Annotationen liegen als kontinuierlicher Wert zwischen 1 (sehr unplausibel) und 5 (sehr plausibel) und als Klassenlabel (unplausibel, neutral, plausibel) vor.

Referenz
Download
Dieses Bild zeigt Michael Roth

Michael Roth

Dr.

Emmy Noether-Gruppenleiter

Talita Rani Anthonio

 

Ehemalige Doktorandin

Dieses Bild zeigt Anna Sauer

Anna Sauer

 

Ehemalige Doktorandin

Zum Seitenanfang