Ampliare l'accesso al patrimonio culturale d'Europa

I nuovi sistemi sviluppati nel quadro del progetto "Cultural Heritage Language Technologies" contribuiranno a schiudere quell'enorme risorsa che è la cultura europea.

Economia digitale

Lo scopo del progetto CHLT era adattare le scoperte della linguistica computazionale, dell'elaborazione del linguaggio naturale e del recupero dell'informazione, per aiutare i ricercatori di scienze umane a progredire nel loro lavoro. In Danimarca, la ricerca della Københavns Universitet si è concentrata su quelle, tra queste tecniche, che sono svincolate dalla lingua, per ottimizzarle in base ai bisogni dei testi delle saghe in norvegese antico. I ricercatori dell'istituto di scienze umane hanno creato trascrizioni elettroniche e immagini ad alta risoluzione delle saghe in norvegese antico presenti nelle loro collezioni; l'istituto di lingue scandinave dell'UCLA ne ha invece curato l'elaborazione. Le risorse lessicali sono state digitalizzate e, a tale scopo, sono stati scritti gli strumenti d'analisi morfologica in grado di ridurre le forme non flesse alle loro possibili forme lessicali. In pratica, un analizzatore sintattico o parser prende la forma non flessa come dato in ingresso (input) e ne produce la forma lessicale, mentre un altro analizzatore sintattico genera paradigmi completi per la parola sulla base della sua forma lessicale. I dati sorgente per questi analizzatori sintattici sono tratti dal "Concise Dictionary of Old Icelandic" di Geir Zoega. Le biblioteche digitali risultanti hanno messo queste tecniche computazionali a disposizione anche dei non esperti, e non solo dei singoli studenti, quali strumenti generici autonomi svincolati dai testi in base ai quali operano. L'ambiente della Perseus digital library consente di visualizzare immagini ad alta risoluzione di volumi stampati e manoscritti rari e fragili, insieme ad ipertesti generati automaticamente. Gli ipertesti offrono al lettore capacità migliorate di sfogliare forme lessicali insieme a dati di frequenza, rimandi a voci per una parola nei dizionari e aiuti grammaticali. Gli utilizzatori di queste funzionalità vanno dagli esperti ai principianti, e includono studenti e grande pubblico. Il progetto cerca collaborazione per stabilire un quadro internazionale con standard aperti per la conservazione a lungo termine dei dati, la condivisione dei metadati e l'interoperabilità tra le biblioteche digitali affiliate.