Erweiterter Zugriff auf das Kulturerbe Europas
Im Rahmen des CHLT-Projekts wurde darauf abgezielt, Entdeckungen aus dem Bereich der Computerlinguistik, der maschinellen Sprachverarbeitung und der Informationsgewinnung aufzugreifen, um Forscher im Bereich der Geisteswissenschaften dabei zu unterstützen, ihre Arbeit voranzutreiben. Die Forschungsarbeiten an der Universität von Kopenhagen konzentrierten sich darauf, welche dieser Techniken sprachabhängig sind, und optimierten sie für die Anforderungen altnordischer Sagentexte. Forscher der geisteswissenschaftlichen Fakultät erstellten elektronische Transkriptionen und hoch aufgelöste Bilder der altnordischen Sagen aus ihrer Sammlung. Derweil beschäftigte man sich im Fachbereich Skandinavistik der UCLA mit deren Bearbeitung. Lexikalische Ressourcen wurden zu diesem Zwecke digitalisiert und morphologische Analyseinstrumente entwickelt, die die gebeugten Formen auf ihre mögliche lexikalische Form reduzieren können. Um es genauer zu sagen, nimmt ein Parser die gebeugte Form als seinen Input und produziert als Output die lexikalische Form. Der andere Parser generiert komplette Paradigmen für das Wort basierend auf dessen lexikalischer Form. Die Quelldaten dieser Parser werden dem "Concise Dictionary of Old Icelandic" von Geir Zoega entnommen. Die neu entstehenden digitalen Bibliotheken machten diese Computertechniken auch für nicht Sachkundige und nicht ausschließlich für einzelne Wissenschaftler zugänglich, denn sie liefern generische Instrumente, die getrennt von den Texten verpackt sind, auf denen sie basieren. Die Umgebung der digitalen Bibliothek Perseus ermöglicht, dass hoch aufgelöste Bilder aus seltenen und brüchigen gedruckten Büchern und Manuskripten zusammen mit automatisch generierten Hypertexten angeschaut werden können. Diese Hypertexte bieten dem Leser neben den Möglichkeiten des Durchstöberns lexikalischer Formen auch Häufigkeitsdaten sowie Links zu den Stichworten in Wörterbüchern und zu grammatikalischen Hilfen. Die Nutzer dieser Funktionsvielfalt reichen von Experten über Leser, die neu auf diesem Gebiet sind, bis hin zu Studenten und zur allgemeinen Öffentlichkeit. Es wird nach weiteren Kooperationen gesucht, um ein internationales Rahmenwerk mit offenen Standards für die Langzeitbewahrung von Daten, die gemeinsame Nutzung von Metadaten und die Zusammenarbeit zwischen nahe stehenden digitalen Bibliotheken aufzubauen.