Lemma-Korrektur-Tools

Skripte zur Konvertierung von POS-Tags des TreeTaggers nach MulText und Korrektur des Lemma-Outputs des RFTaggers und des TreeTaggers

Lemma-Korrektur-Tools

Typ
Tool
Autor
Anita Ramm
Beschreibung

Das Tool wurde im Kontext des Projekts TTC erstellt und enthält Skripte für folgende Aufgaben:

  1. Konvertierung von POS-Tags des TreeTaggers nach MulText
    für DE, EN, ES und FR (EN, ES und FR: nur Nomina, Adjektive und Verben)
  2. Korrektur des Lemma-Outputs des RFTaggers für DE und des TreeTaggers
    für die anderen Sprachen
Referenz

Anita Gojun, Ulrich Heid, Bernd Weissbach, Carola Loth, Insa Mingers (2012). Adapting and evaluating a generic term extraction tool. In: Proceedings of the 8th international conference on Languge Resources and Evaluation (LREC). Istanbul, Turkey. PDF

Download

.zip (version 1.0)

Ulrich Heid

Apl. Prof. PD Dr.
Zum Seitenanfang