Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS
Contenido archivado el 2024-06-18

Analysis and Evaluation of Comparable Corpora for Under Resourced Areas of Machine Translation

Descripción del proyecto


Language-based interaction

Lack of sufficient linguistic resources for many languages and domains currently is one of the major obstacle in further advancement of automated translation. The main goal of the ACCURAT research is to find, analyze and evaluate novel methods how comparable corpora can compensate for this shortage of linguistic resources to improve MT quality significantly for under-resourced languages and narrow domains.The ACCURAT project will provide researchers and developers with novel methodology and fully functional model for exploiting comparable corpora to increase translation quality of existing and emerging MT systems.We will determine criteria to measure the comparability of texts in comparable corpora. Methods for automatic acquisition of a comparable corpus from the Web will be analyzed and evaluated. Advanced techniques will be elaborated to extract lexical, terminological and other linguistic data from comparable corpora to provide training and customization data for MT. Improvements from applying acquired data will be measured against baseline results from MT systems and validated in practical applications.ACCURAT will provide novel approaches to achieve high quality MT translation for a number of under-resourced EU languages (e.g. Estonian, Croatian) and to adapt existing MT technologies to narrow domains (e.g. automotive engineering), significantly increasing the language and domain coverage of MT. ACCURAT methods will be universal and adaptable to new languages and domains.The project consortium has an optimum balance of world-class researchers in all key research areas and industry SME participants ensuring maximum orientation to exploitation needs.The ACCURAT will provide contribution for expected impacts of the Call by providing methods for automatic acquisition and annotation of language resources, removing gaps in language coverage and increasing quality of translation and providing methods for automated translation to make it more adaptive.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

FP7-ICT-2009-4
Consulte otros proyectos de esta convocatoria

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

CP - Collaborative project (generic)

Coordinador

TILDE SIA
Aportación de la UE
€ 435 300,00
Dirección
VIENIBAS GATVE 75 A
LV-1004 RIGA
Letonia

Ver en el mapa

Tipo de actividad
Private for-profit entities (excluding Higher or Secondary Education Establishments)
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

Sin datos

Participantes (8)

Mi folleto 0 0