Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Contenu archivé le 2024-05-15
Cultural Heritage Language Technologies

Article Category

Article available in the following languages:

Un accès plus large au patrimoine culturel européen

Dans le cadre du projet "Cultural Heritage Language Technologies", les partenaires espèrent voir de nouveaux systèmes contribuer à l' "ouverture" de l'énorme ressource que constitue la culture européenne.

Le projet CHLT s'est fixé pour objectif d'adapter des découvertes dans le domaine de la linguistique computationnelle, du traitement du langage naturel et de la récupération d'informations afin d'aider les chercheurs du département des sciences humaines à avancer dans leur travail. Les recherches menées par la Københavns Universitet au Danemark se sont penchées sur les techniques indépendantes du langage et ont tenté de les optimiser en fonction des besoins des sagas en vieux norrois. Des chercheurs du département des sciences humaines ont créé des transcriptions électroniques et des images haute résolution des sagas en vieux norrois tirées de leurs collections, le département scandinave de l'UCLA se chargeant de leur traitement. À cette fin, des ressources lexicales ont été numérisées et des outils d'analyse morphologique ont été mis au point pour réduire les formes infléchies à leurs formes lexicales possibles. De manière plus spécifique, un premier analyseur utilise la forme infléchie en guise d'entrée et renvoie la forme lexicale, tandis que le deuxième génère des paradigmes complets pour le mot sur la base de sa forme lexicale. Les données sources de ces analyseurs sont tirées du "Concise Dictionary of Old Icelandic" de Geir Zoega. Les bibliothèques numériques émergentes ont également mis ces techniques informatiques à la disposition de non-spécialistes, et pas seulement des scientifiques, sous forme d'outils génériques proposés individuellement des textes sur lesquels ils sont utilisés. L'environnement de la bibliothèque numérique Perseus permet de visualiser des images haute résolution de livres imprimés et de manuscrits rares et fragiles, de même que des liens hypertextes générés automatiquement. Ces liens hypertextes offrent au lecteur des possibilités supplémentaires de parcourir des formes lexicales, ainsi que des données de fréquence, des liens vers des entrées d'un mot dans des dictionnaires et des supports grammaticaux. Les utilisateurs de cette fonctionnalité vont des experts à des lecteurs novices, en ce compris les étudiants et le grand public. D'autres collaborations sont recherchées en vue d'établir un cadre international comportant des normes ouvertes pour la préservation à long terme des données, le partage de métadonnées et l'interopérabilité entre des bibliothèques numériques affiliées.

Découvrir d’autres articles du même domaine d’application