Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Article Category

Contenido archivado el 2023-03-02

Article available in the following languages:

Un proyecto de la UE pretende eliminar las barreras lingüísticas

Más de la mitad de los europeos sólo puede mantener una conversación en su propio idioma, pese a que muchos trabajamos en un entorno plurilingüe. La mayoría dependemos de los servicios de traducción profesionales o en línea para que nos ayuden a entender documentos redactados ...

Más de la mitad de los europeos sólo puede mantener una conversación en su propio idioma, pese a que muchos trabajamos en un entorno plurilingüe. La mayoría dependemos de los servicios de traducción profesionales o en línea para que nos ayuden a entender documentos redactados en otras lenguas, pero a menudo sus resultados son inexactos. El proyecto SMART («Análisis estadístico plurilingüe para recuperación y traducción»), financiado por la UE e iniciado recientemente, pretende ayudar a reducir estas barreras lingüísticas valiéndose de la traducción automática estadística. La traducción automática estadística (TAE) es una variante de la traducción automática mediante la cual se generan traducciones basándose en modelos teóricos de información y estadística. Se traduce una palabra o una frase por una de sus varias posibilidades de acuerdo con la probabilidad que tendría de aparecer en el contexto en cuestión. Estas técnicas son especialmente prometedoras para el campo de la traducción, puesto que son mucho más sencillas de desarrollar y consiguen unos resultados equivalentes o superiores al de los sistemas de traducción basados en reglas, que requieren la introducción manual de un gran número de «normas» por parte de lingüistas cualificados. Sin embargo, se han encontrado algunos defectos en estos métodos. Por ejemplo, a pesar de que las traducciones elaboradas con sistemas de traducción automática estadística (TAE) suelen ser más exactas léxicamente que los sistemas basados en normas, el texto que producen suele ser menos fluido. Además, los sistemas TAE se enriquecen leyendo «lotes de documentos» y no permiten que el usuario introduzca modificaciones para mejorar la efectividad. «En el pasado, las técnicas de aprendizaje automático se utilizaron mucho en la traducción automática», dijo Craig Saunders, el socio del proyecto en la facultad de electrónica e informática de la Universidad de Southampton. «Este proyecto pretende ampliar los métodos más tradicionales basados en modelos lineares de logaritmos y también aplicar los avances más recientes en el aprendizaje automático para efectuar previsiones estructuradas, avances que han llevado a gran cantidad de técnicas potentes nuevas que ofrecen grandes posibilidades en este ámbito.» Durante los próximos tres años, el consorcio SMART, coordinado desde Francia por el centro de investigación europeo de Xerox, trabajará con técnicas mejoradas de aprendizaje automático estadístico para tres aplicaciones distintas. Las lenguas de trabajo serán el español, el inglés, el francés y el esloveno. Para la primera aplicación su labor se centrará en la mejora de los sistemas que utilizan los traductores profesionales. «Actualmente, estos sistemas almacenan muchas expresiones habituales, pero si traducen mal una palabra, no pueden autocorregirse», explicó Craig Saunders. «Buscaremos cómo conseguir que estos sistemas se puedan adaptar», dijo. La segunda aplicación se refiere a la situación que afrontan los analistas de atención al cliente que trabajan en centrales telefónicas. «Puede darse la situación de que un técnico sea nativo de un idioma, consulte un manual en otro idioma y esté hablando en un tercer idioma con un cliente», apuntó Craig Saunders. Para el supuesto de un analista nativo inglés que sólo tenga nociones básicas de alemán, se podría crear una interfaz basada en el aprendizaje automático que permita al analista teclear una búsqueda en inglés para encontrar un documento en alemán. Desarrollándolo aún más, este sistema podría incluso destacar los fragmentos más importantes de un texto o las palabras clave en los resultados obtenidos. Finalmente, la tercera aplicación implica permitir que el usuario acceda a secciones de la Wikipedia plurilingüe en lenguas de las que tiene un conocimiento limitado. Estas aplicaciones servirán para entornos de negocios reales, implicando a grupos de usuarios de pequeñas y medianas empresas (PYME) dedicadas a la innovación y Xerox. «Es la primera vez que se utilizan técnicas de aprendizaje automático de este modo», dijo Craig Saunders. «Xerox trabaja con muchas lenguas diferentes y el acceso a la información en todos los idiomas podría ser muy útil en este contexto; la posibilidad de formular una pregunta en una lengua y obtener documentos en otra es útil en gran variedad de aplicaciones.» «Nos estamos esforzando por desarrollar técnicas que ayudarán a los ciudadanos de la UE en general, pero si queremos intentar evaluar la mejora de una forma cuantitativa, entonces esto es más fácil de realizar en un contexto industrial», dijo Craig Saunders a CORDIS Noticias. «Al final del proyecto, si las técnicas son eficaces, queremos publicar algunas páginas web de demostración y ponerlas a disposición de toda la población».

Mi folleto 0 0