"Using linguistic information for hybrid machine translation", Barcellona, Spagna
La traduzione automatica data-driven è sempre più utilizzata all'interno della comunità di ricerca di traduzione automatica. Da un punto di vista qualitativo i risultati sono sempre più positivi, soprattutto quando la lingua di destinazione è l'inglese.
I sistemi di traduzione automatica data-driven si basano su corpora bilingue allineati, i quali sono grandi insiemi di testi strutturati utilizzati per l'analisi statistica e la verifica di ipotesi, la verifica occorrenze o la convalida di regole linguistiche. Per estensione, gli esiti del sistema dipendono fortemente dalla qualità e dalle dimensioni dei corpora. Per molte coppie linguistiche non sono disponibili corpora bilingue di grandi dimensioni e affidabili. Inoltre, la traduzione in lingue di destinazione morfologicamente più ricche rende lo sviluppo di sistemi data-driven piuttosto più difficile.
L'evento metterà in evidenza lo sforzo della ricerca multi-sito, illustrando gli approcci per integrare le informazioni strutturali in soluzioni open-source e lo sviluppo di nuovi parametri di valutazione della traduzione automatica con l'utilizzo di valori linguisticamente motivati.Per ulteriori informazioni, visitare: http://ixa2.si.ehu.es/lihmt2011/(si apre in una nuova finestra)