European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-06-18

Testing the portability of techniques to handle dissimilar source and target languages in MT

Article Category

Article available in the following languages:

Mejores herramientas de traducción automática

Una investigación financiada con fondos europeos aporta nuevas claves al estudio de la traducción automática (TA) que podrían resultar determinantes a nivel social e industrial. En el marco de este proyecto se desarrolló un sistema con una arquitectura avanzada de TA destinado a convertirse en una potente herramienta para investigadores, profesores y alumnos dedicados al campo del procesamiento de lenguajes naturales.

Economía digital icon Economía digital

El proyecto «Testing the portability of techniques to handle dissimilar source and target languages in MT» (ENEUS), financiado con fondos de la Unión Europea, reunió a expertos en los campos de la lingüística, la informática y la traducción. El trabajo del equipo beneficiará a los usuarios de herramientas de TA, además de contribuir al estudio de las interacciones entre los lenguajes artificiales y los humanos. ENEUS evaluó la posibilidad de aplicar la arquitectura de TA Matxin a distintos pares de lenguas. Asimismo, estudió la validez del sistema cuando la lengua de partida es analítica, como es el caso del inglés, y la de destino aglutinante, como el vasco. Gracias a su capacidad de análisis profundo, basado especialmente en la morfosintaxis, Matxin ofreció buenos resultados de traducción entre lenguas dispares. Tras adaptar el sistema español-vasco a la combinación inglés-vasco, se creó una herramienta piloto de traducción automática basada en reglas (RBMT). Este prototipo cuenta con 35 000 entradas. Permite traducir oraciones simples afirmativas, negativas e interrogativas en cualquier tiempo del indicativo para los cuatro paradigmas sujeto-objeto, así como voces activas o pasivas e imperativos. El equipo de ENEUS analizó las características aglutinantes y el orden de las palabras en inglés, vasco, finés y húngaro, siendo las tres últimas lenguas aglutinantes. El consorcio logró demostrar que los sistemas de TAE (traducción automática estadística) ofrecen resultados dispares con las distintas lenguas aglutinantes, mientras que un planteamiento orientado a la lengua origen podría resultar factible y pertinente en estos casos. Las investigaciones sobre alineación de los pares inglés-finés, inglés-húngaro e inglés-vasco dieron lugar al desarrollo de sistemas ENEUS de TAE para todas las combinaciones citadas. El programa de difusión de ENEUS incluía la realización de pruebas piloto con más de quinientos usuarios, los cuales compararon cuatro sistemas de TA entre el inglés y el vasco desarrollados por el consorcio y el traductor más moderno lanzado por Google. Los resultados de la evaluación dejaron patente que el sistema de TAE con reconocimiento morfológico era tan eficaz como el traductor de Google, y que estas dos herramientas superaban al resto. El mejor sistema de ENEUS se ha integrado en la plataforma de traducción Bologna Translation Service de Elhuyar, y los usuarios podrán acceder a los prototipos de ENEUS a través de la página web de Matxin (gestionada por Elhuyar). El sistema RBMT de TA es el primero de código abierto para la combinación de lenguas inglés-vasco. Esta herramienta está a disposición de los desarrolladores en sourceforge y ofrece opciones de desarrollo e investigación con el inglés y el español como lenguas de partida y cualquier otro idioma como lengua de destino.

Palabras clave

Traducción automática, procesamiento lingüístico, lingüística, ciencia informática, lenguaje humano

Descubra otros artículos del mismo campo de aplicación