European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Global Under-Resourced MEedia Translation

Article Category

Article available in the following languages:

Un progetto di Orizzonte 2020 consente la realizzazione del maggior esperimento di traduzione automatica nel campo delle notizie globali

Rispondendo alla necessità dei media di tutto il mondo di disporre di traduzioni rapide e precise per lingue dotate di scarse risorse di dati, un progetto finanziato dall’UE ha spinto i confini della ricerca e delle soluzioni per le redazioni.

Economia digitale icon Economia digitale

Sebbene la traduzione automatica neurale stia compiendo passi da gigante, per molte lingue i risultati non sono ancora sufficientemente solidi da garantirne un utilizzo nei flussi di lavoro delle redazioni, dove la precisione rappresenta la preoccupazione fondamentale. Il progetto GoURMET, finanziato dall’UE, si è prefisso di migliorare il potenziale della traduzione automatica neurale per combinazioni e settori linguistici a bassa intensità di risorse. GoURMET si è incentrato sul monitoraggio dei media, sulla creazione dei contenuti e su miglioramenti specifici a livello settoriale concentrando l’attenzione su contenuti nel campo della salute in 16 combinazioni linguistiche con scarsa disponibilità di risorse. Alla luce del potenziale di pubblico settimanale per i due organismi mediatici emittenti coinvolti nel progetto in relazione a queste lingue, che supera 120 milioni di unità, il progetto costituisce il più vasto esperimento internazionale di traduzione automatica (TA) mai realizzato da emittenti di notizie a livello globale. Tre università di punta in questo settore, ovvero quelle di Edimburgo (la coordinatrice di GoURMET), di Alicante e di Amsterdam, hanno lavorato a stretto contatto con i team responsabili dell’innovazione della British Broadcasting Corporation (BBC) e della Deutsche Welle (DW) allo scopo di individuare le lingue di interesse, raccogliere dati relativi ad addestramento e test dal proprio portafoglio di contenuti e farne valutare i risultati nella lingua bersaglio da giornalisti madrelingua. Il progetto, che ha avuto una durata di 42 mesi, ha dovuto tuttavia affrontare sfide impreviste. «Nel corso degli ultimi anni abbiamo assistito a un’incredibile serie di cattive notizie, dalla COVID al colpo di stato in Myanmar, fino all’invasione dell’Ucraina», confessa Alexandra Birch, la coordinatrice del progetto. «Coinvolgere nel progetto giornalisti ed esperti linguistici, che erano sottoposti a un’enorme pressione a causa del massiccio impatto esercitato dalla COVID-19 sui flussi di lavoro quotidiani di produzione, è stato un compito particolarmente impegnativo.» «Ma non erano solamente i media a trovarsi sotto pressione. I nostri collaboratori in Myanmar sono scomparsi durante la fase del progetto in cui stavamo sviluppando i modelli di traduzione per la lingua birmana, in quanto ricercatori e accademici erano in prima linea nelle proteste contro il regime militare», rivela Birch.

Potenziare i contenuti e i dati nelle lingue dotate di risorse insufficienti

Al momento in cui GoURMET ha avuto inizio, gli articoli sulla traduzione automatica a bassa intensità di risorse pubblicavano i propri risultati sulle lingue europee con la minor quantità di dati disponibili, come il rumeno o il finlandese, oppure su piccole porzioni di combinazioni linguistiche dotate di una grande quantità di risorse, come il tedesco. «Il settore ha compiuto enormi progressi e siamo stati in grado di svolgere un ruolo attivo in tal senso», osserva Birch. I ricercatori hanno effettuato tre attività condivise su lingue a bassa intensità di risorse quali gujarati, tamil e hausa, registrando una grande partecipazione in ambito sia industriale che accademico. Gli studiosi hanno messo a disposizione più di 80 pubblicazioni, oltre ad aver fornito modi migliori per raccogliere i dati, nonché i dati stessi e i modelli, che sono tutti reperibili gratuitamente.

Spianare la strada al futuro della traduzione automatica nelle redazioni

I modelli di GoURMET sono open-source, facilmente accessibili, installabili a livello locale, a basso costo e di qualità elevata, il che li rende competitivi rispetto ai sistemi commerciali, anch’essi integrati. Il quadro fornito dal progetto al fine di esplorare e sperimentare casi d’uso effettivi del mondo mediatico ha aiutato l’incubatore di innovazione BBC News Labs a sviluppare un kit di attrezzi multilingue per il giornalismo. Tra tali strumenti figura una piattaforma di monitoraggio per seguire gli sviluppi notiziari in qualsiasi lingua, dimostratasi particolarmente influente nel corso di eventi globali di primaria importanza come la guerra tra Russia e Ucraina; uno strumento di scoperta per individuare e ripristinare i migliori articoli originali, e infine un generatore di grafica alimentato da modelli di TA. Grazie a questo lavoro, News Labs è stato selezionato tra i candidati alla ricezione di un premio per l’innovazione assegnato da BBC News e del riconoscimento Computing Technology Product Award. DW ha integrato con successo la traduzione automatica in un servizio per la produzione di trascrizioni, traduzioni, sottotitoli e doppiaggio chiamato «plain X», che a breve verrà introdotto ai giornalisti della stessa emittente.

Parole chiave

GoURMET, traduzione automatica, media, lingua con poche risorse, traduzione automatica neurale

Scopri altri articoli nello stesso settore di applicazione