European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Common Language Resources and Technology Infrastructure

Article Category

Article available in the following languages:

Dati sul linguaggio basato su Web e strumenti di elaborazione

Gli scienziati finanziati dall'UE hanno raccolti i dati disponibili su discorso e linguaggio digitale e sugli strumenti di elaborazione in un'architettura basata sul Web, Si tratta di una struttura facile da utilizzare anche da esperti di scienze umane senza competenze tecniche, oltre che da altri che operano in campi con un profilo storicamente più orientato all'ambito tecnico.

Salute icon Salute

Il linguaggio è ciò che distingue gli esseri umani dagli altri animali e organismi, perciò riuscire a conoscere la struttura, l'uso e l'evoluzione del linguaggio e del discorso permette di capire meglio aspetti molto diversi come gli schemi delle migrazioni seguiti storicamente dalle varie popolazioni e i criteri per lo sviluppo di motori di ricerca per il Web. L'elaborazione del linguaggio e del discorso è un campo multidisciplinare che comprende non solo la linguistica, ma anche psicologia, elaborazione neurale e cognizione, informatica, ingegneria elettrica e informatica e matematica. I ricercatori europei di scienze umane e sociali hanno dato vita al progetto Clarin ("Common language resources and technology infrastructure") per sviluppare un'infrastruttura di dati e strumenti unificati per il linguaggio. L'obiettivo principale non consisteva nell'acquisire nuove conoscenze, quanto nello sfruttare al meglio l'abbondanza di risorse nazionali ed europee già disponibili. Il progetto si proponeva di porre le basi necessarie per unificare i dati e gli strumenti esistenti in una struttura comune, accessibile da tutta al comunità di ricerca. L'architettura dati distribuita è stata studiata per fornire servizi Web ai ricercatori e per consentire agli utenti non esperti l'esecuzione di attività complesse e sfruttare quindi la gran quantità di strumenti di elaborazione del linguaggio e del discorso sviluppata negli anni più recenti. Il team ha creato un osservatorio del linguaggio virtuale (Virtual Language Observatory, VLO, http://www.clarin.eu/vlo/) che mette a disposizione i dati analizzati e riepilogati su tutte le risorse e gli strumenti relativi al linguaggio raccolti dai partner di Clarin. Molte comunità di esperti di scienze umane e sociali non hanno familiarità con gli strumenti e le tecnologie di elaborazione linguistica, poiché il loro settore è stato tradizionalmente poco orientato alla tecnologia. La creazione di rapporti tra queste comunità è un risultato importante ottenuto dal progetto Clarin. Oltre alle considerazioni tecniche, Clarin ha affrontato il problema della governance e dei finanziamenti futuri, approfondendo tra l'altro gli aspetti legati ai possibili modelli legali, finanziari e organizzativi. I partner del progetto sono riusciti a mobilitare una vasta comunità di ricerca in questi settori per porre le basi per un'infrastruttura comune delle risorse e degli strumenti inerenti il linguaggio. L'accesso a una varietà tanto ampia di dati e strumenti permetterà agli scienziati di farsi domande tradizionali in termini nuovi e di porsi nuovi interrogativi che finora, per limiti di dati e di tecnologia, non erano stati in grado di affrontare. Senza dubbio, l'infrastruttura Clarin ha creato le basi per interessanti nuove interpretazioni nel settore dell'elaborazione del linguaggio e del discorso.

Scopri altri articoli nello stesso settore di applicazione