El JRC publica textos para ayudar al desarrollo de sistemas de traducción asistida por ordenador
El Centro Común de Investigación (JRC) de la Unión Europea ha publicado un millón de frases traducidas a veintidós idiomas oficiales de la UE, en un esfuerzo por ayudar al desarrollo de las tecnologías y del software de traducción asistida por ordenador. Al ofrecer acceso libre y abierto a este corpus de frases, la UE espera fomentar el plurilingüismo y proporcionar un recurso valioso para que los desarrolladores de sistemas puedan crear software para la traducción automática. Como parte de sus competencias, la UE traduce todos sus documentos jurídicos y políticos a los 23 idiomas oficiales, lo que significa que los traductores deben trabajar con 253 combinaciones de pares de idiomas posibles y producen un millón y medio de páginas al año. Esto también significa que hay un corpus de textos traducidos que tiene gran valor, como base de aprendizaje, para los desarrolladores de sistemas. «Mediante esta iniciativa, la Comisión Europea tiene la intención de fomentar las tecnologías del lenguaje humano, apoyar el plurilingüismo y hacer la traducción asistida por ordenador más fácil, más barata y más accesible», afirmó Leonard Orban, Comisario europeo de Multilingüismo. Si bien es relativamente fácil encontrar en Internet documentos en inglés y francés que contribuyan a tales avances, es mucho más difícil encontrar documentos traducidos del letón al rumano, por ejemplo. «Los ciudadanos que pertenecen a comunidades lingüísticas más pequeñas tendrán un acceso más fácil a aquellos documentos y aquellas páginas Web que están disponibles sólo en las lenguas más comunes», continuó diciendo el Sr. Orban. Debido a que el texto se presenta en contexto, también puede ayudar a desarrollar y probar correctores de gramática y ortografía, diccionarios en línea y sistemas de clasificación de textos. «Este corpus único de información lingüística contribuye a la creación de una nueva generación de herramientas de software para el procesamiento del lenguaje humano y ayuda a fomentar la competitividad de la industria de la lengua, que es una de las industrias de más rápido crecimiento en la Unión Europea», afirmó Janez Potocnik, Comisario europeo de Ciencia e Investigación.