Servizio Comunitario di Informazione in materia di Ricerca e Sviluppo - CORDIS

Metodi di ricerca e strumenti all’avanguardia per accelerare la distribuzione dei sistemi di traduzione automatica

L’Europa si affaccia a una delle sue più grandi sfide in ambito di multilinguismo. Per affrontare questo problema, un’iniziativa dell’UE ha rafforzato la cooperazione tra industria e mondo accademico al fine di invertire i bassi livelli di adozione industriale relativi alla traduzione automatica (MT).
Metodi di ricerca e strumenti all’avanguardia per accelerare la distribuzione dei sistemi di traduzione automatica
Il progetto ABU-MATRAN (Automatic building of machine translation), finanziato dall’UE, ha sviluppato un set di strumenti per intensificare lo sviluppo di sistemi di traduzione automatica statistici e sistemi di traduzione automatica basati su regole. Sono state sviluppate anche tecniche per migliorare la qualità della traduzione relativa a lingue morfologicamente ricche.

I partner del progetto hanno fornito MT per la lingua croata. Questo sistema di MT online per la traduzione inglese-croato si basa su su risorse pubblicamente disponibili, ed è stato rilasciato nel 2013 in occasione dell’adesione del paese all’UE. Il sistema è stato ulteriormente migliorato, seguendo l’approccio MT neurale e utilizzando tecniche di selezione dei dati, e un sistema basato su regole di MT per la lingua serbo-croata, sviluppato in collaborazione durante i distaccamenti del progetto.

È stato creato anche un sistema di MT croato specifico per il turismo. Tale sistema è stato creato utilizzando dati paralleli sul turismo acquisiti da crawler web sviluppati durante il progetto. I risultati dimostrano che questo sistema sorpassa altri sistemi MT online per questa coppia di lingue e per tale dominio di traduzione.

Il team del progetto ABU-MATRAN ha quindi esteso il sistema MT per la lingua croata alle altre lingue slave meridionali dei paesi candidati. I ricercatori hanno rilasciato sistemi MT per la lingua bosniaca, serba e slovena. Le tecniche sviluppate per queste tre lingue sono state applicate con successo ad altre lingue, dimostrando così il loro alto grado di indipendenza del linguaggio. Vale a dire che i ricercatori hanno sviluppato sistemi MT per inglese-finlandese, spagnolo-catalano e spagnolo-basco.

Nell’ambito del progetto, sono stati attuati dei distaccamenti e organizzati diversi seminari al fine di trasferire le conoscenze su questioni quali gestione e processi, dal settore industriale al mondo accademico. Questi eventi hanno mirato a rendere più robusti i prodotti di ricerca e sviluppo e si sono concentrati su aspetti quali gestione software efficiente e creazione di dati linguistici. Ai fini di un efficace trasferimento di conoscenze oltre il progetto, tutte le risorse sono state rilasciate come software gratuito open source e sono disponibili sul sito web del progetto.

Il progetto ABU-MATRAN ha identificato pratiche di ricerca chiave per accelerare la realizzazione di sistemi di traduzione automatica e allo scopo di preparare tali sistemi per lo sfruttamento commerciale. In maniera altrettanto importante, l’iniziativa ha trasportato questa conoscenza all’industria.

Informazioni correlate

Argomenti

Life Sciences

Keywords

Traduzione automatica, ABU-MATRAN, crawler web