Un accès plus large au patrimoine culturel européen
Le projet CHLT s'est fixé pour objectif d'adapter des découvertes dans le domaine de la linguistique computationnelle, du traitement du langage naturel et de la récupération d'informations afin d'aider les chercheurs du département des sciences humaines à avancer dans leur travail. Les recherches menées par la Københavns Universitet au Danemark se sont penchées sur les techniques indépendantes du langage et ont tenté de les optimiser en fonction des besoins des sagas en vieux norrois. Des chercheurs du département des sciences humaines ont créé des transcriptions électroniques et des images haute résolution des sagas en vieux norrois tirées de leurs collections, le département scandinave de l'UCLA se chargeant de leur traitement. À cette fin, des ressources lexicales ont été numérisées et des outils d'analyse morphologique ont été mis au point pour réduire les formes infléchies à leurs formes lexicales possibles. De manière plus spécifique, un premier analyseur utilise la forme infléchie en guise d'entrée et renvoie la forme lexicale, tandis que le deuxième génère des paradigmes complets pour le mot sur la base de sa forme lexicale. Les données sources de ces analyseurs sont tirées du "Concise Dictionary of Old Icelandic" de Geir Zoega. Les bibliothèques numériques émergentes ont également mis ces techniques informatiques à la disposition de non-spécialistes, et pas seulement des scientifiques, sous forme d'outils génériques proposés individuellement des textes sur lesquels ils sont utilisés. L'environnement de la bibliothèque numérique Perseus permet de visualiser des images haute résolution de livres imprimés et de manuscrits rares et fragiles, de même que des liens hypertextes générés automatiquement. Ces liens hypertextes offrent au lecteur des possibilités supplémentaires de parcourir des formes lexicales, ainsi que des données de fréquence, des liens vers des entrées d'un mot dans des dictionnaires et des supports grammaticaux. Les utilisateurs de cette fonctionnalité vont des experts à des lecteurs novices, en ce compris les étudiants et le grand public. D'autres collaborations sont recherchées en vue d'établir un cadre international comportant des normes ouvertes pour la préservation à long terme des données, le partage de métadonnées et l'interopérabilité entre des bibliothèques numériques affiliées.