Institut

Studium

Forschung


 

DIRNDL

Typ Corpus
Titel DIRNDL

Beschreibung

DIRNDLDas DIRNDL-Korpus -- (D)iskurs-(I)nformations-(R)adio-(N)achrichten-(D)atenbank für (L)inguistische Analysen -- basiert auf stündlich gesendeten Radionachrichten. Die textuelle Version der Nachrichten wurde mit syntaktischen Strukturen und darauf aufbauendem Informationsstatus annotiert. Auf Basis der gesprochenen Version wurden Akzente und prosodische Phrasengrenzen annotiert. Da textuelle und gesprochene Version leicht voneinander abweichen (Versprecher, kleinere Modifikationen) wurde in der Datenbank eine Verbindung der beiden Versionen (semi-automatisch) hinzugefügt. Durch diese Verbindung können nun Zusammenhänge zwischen den einzelnen annotierten Ebenen (Prosodie und Syntax, Informationsstatus und Prosodie, etc.) untersucht werden. Von besonderem Interesse ist das Vorhandensein mehrerer Wiederholungen derselben Nachrichten, die jeweils mit leicht abweichender Prosodie gelesen werden.


Referenz

Eckart, Kerstin; Riester, Arndt; Schweitzer, Katrin (2012) A Discourse Information Radio News Database for Linguistic Analysis. In Christian Chiarcos; Sebastian Nordhoff and Sebastian Hellmann, editors, Linked Data in Linguistics. Representing and Connecting Language Data and Language Metadata pp. 65-75 Springer, Heidelberg. pdf

Björkelund, Anders; Eckart, Kerstin; Riester, Arndt; Schauffler, Nadja; Schweitzer, Katrin (2014). The Extended DIRNDL Corpus as a Resource for Automatic Coreference and Bridging Resolution. In Proceedings of LREC, Reykjavik, pp. 3222-3228. pdf

Rösiger, Ina and Riester, Arndt (2015). Using prosodic annotations to improve coreference resolution of spoken text. In: Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics (ACL-IJCNLP) pp. 83-88 Beijing. pdf.

Riester, Arndt; Piontek, Jörn (2015). Anarchy in the NP. When new nouns get deaccented and given nouns don't. Lingua 165(B): 230-253. pdf. Adjective-noun data sets: deaccented nouns, accented given nouns


Download

DIRNDL_anaphora, beschrieben in Björkelund et al. (2014), kann hier heruntergeladen werden.

Die DIRNDL-Version aus Rösiger and Riester (2015) kann hier heruntergeladen werden.