Ressourcen für automatisches Fact-Checking in biomedizinischen Tweets

Tweets mit biomedizinischen Behauptungen (BioClaim), Tweets mit annotierten biomedizinischen Entitäten und Relationen (BEAR) und Tweets mit Labels und Evidenztexten für Fact-Checking zu Covid-19 (CoVERT)

BioClaim: Biomedizinische Behauptungen in Tweets

Typ

Korpus

Autor:innen

Amelie Wührl, Roman Klinger

Beschreibung

Ein Korpus von 1200 Twitter Posts mit Annotationen von expliziten und impliziten biomedizinischen Behauptungen.

Die Annotationen im Datensatz sind unter einer CC BY-SA Lizenz lizenziert.

Referenz

Wührl, A., & Klinger, R. (2021). Claim Detection in Biomedical Twitter Posts. BioNLP: Proceedings of the 2021 Workshop on Biomedical Natural Language Processing. [paper]

Wührl, A., & Klinger, R. (2021). Claim Detection in Biomedical Twitter Posts as a Prerequisite for Fact-Checking [Poster presentation]. BioCreative VII Workshop. [poster] [abstract]

Download

BEAR: Biomedizinische Entitäten und Relationen in Tweets

Typ

Korpus

Autor:innen

Amelie Wührl, Roman Klinger

Beschreibung

Ein Korpus von 2100 Twitter Posts annotiert mit 14 verschiedenen Typen von biomedizinischen Enititäten (z.B. Krankheiten, Behandlung, Risikofaktor etc.) und 20 Relationstypen (u.a. verursacht, behandelt, verschlimmert etc.).

Die Annotationen im Datensatz sind unter einer CC BY-SA Lizenz lizenziert.

Referenz

Wührl, A., & Klinger, R. (2022). Recovering Patient Journeys: A Corpus of Biomedical Entities and Relations on  Twitter (BEAR). Proceedings of The 13th Language Resources and Evaluation Conference. [paper]

Download

CoVERT: Fact-checking Labels und Evidenzen für Tweets zu Covid-19

Typ

Korpus

Autor:innen

Isabelle Mohr, Amelie Wührl, Roman Klinger

Beschreibung

Ein Korpus von 300 Twitter Posts mit Behauptungen über Covid-19. Jeder Tweet verfügt über drei mittels Crowdsourcing annotierten Fact-Checking Labels (supports, refutes, not enough info) und Evidenztexten, die das Label untermauern.

Die Annotationen im Datensatz sind unter einer CC BY-SA Lizenz lizenziert.

Referenz

Mohr, I. & Wührl, A. & Klinger, R. (2022). CoVERT: A Corpus of Crowdsourced Fact-checking Verdicts for Biomedical
COVID-19 Tweets. Proceedings of The 13th Language Resources and Evaluation Conference.  [paper]

Download

BEAR-Fact: Fact-checking Labels und Evidenztexte für entitäts- und relationsbasierte biomedizinische Behauptungen in Tweets

Typ

Korpus

Autor:innen

Amelie Wührl, Yarik Menchaca Resendiz, Lara Grimminger und Roman Klinger

Beschreibung

Ein Twitter-Datensatz annotiert mit Fact-checking Labels, Evidenztexten und strukturierten Entitäts- und Relationsinformationen.

Die Annotationen im Datensatz sind unter einer CC BY-SA Lizenz lizenziert.

Referenz

Wührl, A., Menchaca Resendiz, Y., Grimminiger, L.,  and  Klinger, R. (2024). What Makes Medical Claims (Un)Verifiable? Analyzing Entity and Relation Properties for Fact Verification. In of the 18th Conference of the European Chapter of the Association for Computational Linguistics. [paper]

 

Download

Dieses Bild zeigt Roman Klinger

Roman Klinger

Prof. Dr.

Gastprofessor

Zum Seitenanfang