GerDraCor-Coref - German Drama Corpus for Coreference

Ein Korpus mit Koreferenzannotationen auf deutschen Dramen

GerDraCor-Coref - German Drama Corpus for Coreference

Typ

Korpus

Autor

Janis Pagel, Nils Reiter

Beschreibung

Das Korpus umfasst etwa 40 Akte aus 30 deutschen Dramen, die mit Koreferenzinformationen annotiert wurden. Die Texte spannen eine Zeit von 1730 - 1920. Die Annotationen liegen in verschiedenen Formaten vor: CoNLL 2012, TEI und XMI. Die CoNLL-Daten enthalten automatisch hinzugefügte linguistische Informationen wie etwa Wortarten und Lemmas. Die TEI-Daten enthalten Strukturinformationen wie Akt- und Szenengrenzen und Sprecherwechsel.

Referenz

Janis Pagel, Nils Reiter. GerDraCor-Coref: A Coreference Corpus for Dramatic Texts in German. In Proceedings of the Language Resources and Evaluation Conference (LREC), pp. 55-64, Marseille, Frankreich, Mai 2020. Url: http://www.lrec-conf.org/proceedings/lrec2020/pdf/2020.lrec-1.7.pdf.

Download

GitHub

Zum Seitenanfang