Institut

Studium

Forschung


 

CoInCo: Concepts in Context

Typ Corpus
Titel CoInCo: Concepts in Context
Autor Sebastian Pado

Beschreibung

CoInCo (Concepts in Context) ist ein relativ großes all-words lexical substitution-Korpus für das Englische auf Grundlage der newswire- und fiction-Teile des frei zugänglichen MASC-Korpus. Es umfaßt 35.000 Tokens laufenden Text, bei dem für alle 15,500 Tokens von Inhaltswörtern mit Crowdsourcing-Methoden mindestens 6 Synonyme generiert wurden, wobei den Teilnehmern der Satz sowie zwei Sätze Diskurskontext zur Verfügung standen.


Referenz

Gerhard Kremer, Katrin Erk,Sebastian Pado, Stefan Thater: What Substitutes Tell Us – Analysis of an “All-Words” Lexical Substitution Corpus. To appear in Proceedings of EACL 2014. Göteborg, Schweden.


Download

Daten (.xml.gz)

README (.txt)

Development Set IDs

Test Set IDs