Erschlie?ung digitaler Textarchive über Metadaten und Lemmata

Auf einen Blick

Laufzeit
01/2013  – 08/2015
F?rderung durch

Bundesministerium für Forschung, Technologie und Raumfahrt

Projektbeschreibung

Ziel des Projekts ist die Entwicklung eines Werkzeugs, das eine bessere Erschlie?ung ausgew?hlter historischer Archive erm?glichen und den Weg zur Erschlie?ung weiterer Archive ebenen soll. Das Suchwerkzeug soll eine Abfrage nach Lemmata erm?glichen und auf der Grundlage von Metadaten ein geeignetes Korpus zusammenstellen. Die dazu ben?tigten Sekund?rdaten und Werkzeuge (Datenbanken, Lexika, morphologische Analysierer) sollen über Webservices bereitgestellt werden.
Das Projekt wird am Beispiel des Polnischen ausgeführt, ein mit seinen zahlreichen Flexionen und der starken orthographischen Variation eher schwieriges Fallbeispiel. Dadurch sollte allerdings auch die ?bertragbarkeit des Werkzeugs auf andere Sprachen gut m?glich sein Die Zusammenarbeit mit den CLARIN-D Zentren in Saarbrücken, Tübingen, Nijmegen, Berlin und Leipzig ist von elementarer Bedeutung für die Realisierung des Kurationsprojekts.