«Empleo de información lingüística en la traducción automática híbrida» en Barcelona (España)
La traducción automática basada en datos se utiliza cada vez más en el ámbito de la comunidad científica dedicada a la traducción automática. Desde el punto de vista de la calidad, los resultados son cada vez más útiles, sobre todo si el idioma objetivo es el inglés.
Los sistemas de traducción basados en datos se apoyan en corpus bilingües alineados, conjuntos de textos estructurados y de gran volumen que se utilizan para el análisis estadístico y la comprobación de hipótesis, la comprobación de ocurrencias y la validación de normas lingüísticas. Por tanto, los resultados de estos sistemas dependen en gran medida de la calidad y el tamaño de los corpus. No obstante, existen muchos pares de idiomas para los que no se dispone de corpus bilingües grandes y fiables. Además, el desarrollo de sistemas basados en datos se complica sobremanera cuando se pretende traducir hacia idiomas morfológicamente complejos.
El evento servirá para exponer trabajos de investigación entre varios centros dedicados a integrar información estructural en soluciones de código abierto y al desarrollo de sistemas de evaluación que empleen métricas que respondan a patrones lingüísticos.Para más información, consulte: http://ixa2.si.ehu.es/lihmt2011/(se abrirá en una nueva ventana)