| Title: | Ein Suchwerkzeug für syntaktisch annotierte Textkorpora | |
| Author: | Wolfgang Lezius | |
| Year: | December 2002 | |
| Reference: | Arbeitspapiere des Instituts für Maschinelle Sprachverarbeitung (AIMS), 2002, vol. 8, no. 4 | |
| Institution: | IMS, University of Stuttgart, Germany | |
| Language: | German | |
| Download: | Postscript (1672 KB) - PDF (1464 KB) |
Extended abstract: Postscript (216 KB) - PDF (112 KB)
Der erste Teil der Arbeit stellt bisherige Arbeiten im Bereich Baumbank-Suchwerkzeuge und Baumbank-Repräsentationsformate vor. Die Diskussion dieser Arbeiten zeigt, dass kein verfügbares Suchwerkzeug die Besonderheiten der TIGER-Baumbank vollständig abdeckt, so dass die Entwicklung eines speziellen Werkzeugs erforderlich ist.
Der zweite Teil stellt eine Korpusbeschreibungssprache vor, die sowohl zur Korpusdefinition als auch zur Korpusanfrage verwendet wird. Durch diese Verbindung ergeben sich zahlreiche Vorteile, u.a. muss lediglich die Syntax und Semantik einer Sprache formal definiert werden. Mit dem XML-basierten TIGER-XML-Format wird eine weitere Sprache beschrieben, die zur Korpusdefinition der Beschreibungssprache semantisch äquivalent ist und dabei zahlreiche technische Probleme wie die Kodierung von Sonderzeichen löst. Eine formale Definition der Syntax und Semantik der Beschreibungssprache schließt diesen Teil der Arbeit ab.
Im dritten Teil wird die Verarbeitung von Korpusanfragen behandelt. Dazu wird zunächst ein Logikkalkül definiert, der einen syntaktischen Ableitungsbegriff definiert. Hier wird mit Hilfe von Verarbeitungsregeln überprüft, ob eine Anfrage aus einem Korpus folgt. Die Abfrageverarbeitung des Suchwerkzeugs implementiert diesen Kalkül. Die Implementation setzt sich aus der Repräsentation des Korpus als Index und der Anfrageverarbeitung zur Laufzeit zusammen. Die Konzeption und Realisierung der Implementation werden detailliert beschrieben. Überlegungen zur Verbesserung der Verarbeitungseffizienz runden diesen Teil ab.
Der abschließende vierte Teil der Arbeit behandelt ausgewählte Aspekte der grafischen Benutzeroberfläche. Hier werden u.a. Konzepte zur Visualisierung von Anfrageergebnissen und Ideen zur grafischen Eingabe von Suchanfragen vorgestellt.
@PhdThesis{LeziusDiss,
author = "Wolfgang Lezius",
title = "Ein Suchwerkzeug f{\"u}r syntaktisch annotierte Textkorpora",
school = "IMS, University of Stuttgart",
year = 2002,
month = "December",
note = "{A}rbeitspapiere des Instituts für Maschinelle Sprachverarbeitung (AIMS), volume 8, number 4",
url = "http://www.ims.uni-stuttgart.de/projekte/corplex/paper/lezius/diss/",
postscript = "http://www.ims.uni-stuttgart.de/projekte/corplex/paper/lezius/diss/disslezius.ps.gz",
pdf = "http://www.ims.uni-stuttgart.de/projekte/corplex/paper/lezius/diss/disslezius.pdf"
}
This page has been created by Wolfgang Lezius. Last modified on 7.4.2003.