European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
Contenuto archiviato il 2024-06-18

Automatic building of Machine Translation

Article Category

Article available in the following languages:

Metodi di ricerca e strumenti all’avanguardia per accelerare la distribuzione dei sistemi di traduzione automatica

L’Europa si affaccia a una delle sue più grandi sfide in ambito di multilinguismo. Per affrontare questo problema, un’iniziativa dell’UE ha rafforzato la cooperazione tra industria e mondo accademico al fine di invertire i bassi livelli di adozione industriale relativi alla traduzione automatica (MT).

Economia digitale icon Economia digitale
Tecnologie industriali icon Tecnologie industriali
Società icon Società
Ricerca di base icon Ricerca di base

Il progetto ABU-MATRAN (Automatic building of machine translation), finanziato dall’UE, ha sviluppato un set di strumenti per intensificare lo sviluppo di sistemi di traduzione automatica statistici e sistemi di traduzione automatica basati su regole. Sono state sviluppate anche tecniche per migliorare la qualità della traduzione relativa a lingue morfologicamente ricche. I partner del progetto hanno fornito MT per la lingua croata. Questo sistema di MT online per la traduzione inglese-croato si basa su su risorse pubblicamente disponibili, ed è stato rilasciato nel 2013 in occasione dell’adesione del paese all’UE. Il sistema è stato ulteriormente migliorato, seguendo l’approccio MT neurale e utilizzando tecniche di selezione dei dati, e un sistema basato su regole di MT per la lingua serbo-croata, sviluppato in collaborazione durante i distaccamenti del progetto. È stato creato anche un sistema di MT croato specifico per il turismo. Tale sistema è stato creato utilizzando dati paralleli sul turismo acquisiti da crawler web sviluppati durante il progetto. I risultati dimostrano che questo sistema sorpassa altri sistemi MT online per questa coppia di lingue e per tale dominio di traduzione. Il team del progetto ABU-MATRAN ha quindi esteso il sistema MT per la lingua croata alle altre lingue slave meridionali dei paesi candidati. I ricercatori hanno rilasciato sistemi MT per la lingua bosniaca, serba e slovena. Le tecniche sviluppate per queste tre lingue sono state applicate con successo ad altre lingue, dimostrando così il loro alto grado di indipendenza del linguaggio. Vale a dire che i ricercatori hanno sviluppato sistemi MT per inglese-finlandese, spagnolo-catalano e spagnolo-basco. Nell’ambito del progetto, sono stati attuati dei distaccamenti e organizzati diversi seminari al fine di trasferire le conoscenze su questioni quali gestione e processi, dal settore industriale al mondo accademico. Questi eventi hanno mirato a rendere più robusti i prodotti di ricerca e sviluppo e si sono concentrati su aspetti quali gestione software efficiente e creazione di dati linguistici. Ai fini di un efficace trasferimento di conoscenze oltre il progetto, tutte le risorse sono state rilasciate come software gratuito open source e sono disponibili sul sito web del progetto. Il progetto ABU-MATRAN ha identificato pratiche di ricerca chiave per accelerare la realizzazione di sistemi di traduzione automatica e allo scopo di preparare tali sistemi per lo sfruttamento commerciale. In maniera altrettanto importante, l’iniziativa ha trasportato questa conoscenza all’industria.

Parole chiave

Traduzione automatica, ABU-MATRAN, crawler web

Scopri altri articoli nello stesso settore di applicazione