CORDIS - Resultados de investigaciones de la UE
CORDIS

Multi-modal Context Modelling for Machine Translation

Descripción del proyecto

Una nueva era en la traducción automática

En el ámbito del procesamiento del lenguaje natural (PLN), se persigue desde hace tiempo el objetivo de traducir automáticamente el lenguaje humano. Sin embargo, los métodos actuales —como la traducción automática estadística—, suelen ignorar señales contextuales fundamentales presentes en las traducciones humanas. En consecuencia, las traducciones carecen de información relevante o transmiten significados incorrectos, lo cual dificulta la comprensión lectora haciéndolas inútiles en muchos casos. En este contexto, el equipo del proyecto MultiMT, financiado por el Consejo Europeo de Investigación, está adoptando un método innovador al aprovechar la información multimodal global. Asimismo, se desarrollarán métodos para incorporar a los modelos de traducción señales contextuales como imágenes, documentos conexos y metadatos. Las publicaciones en Twitter y las reseñas de productos se utilizarán como conjuntos de datos de prueba. Esta iniciativa interdisciplinar combina conocimientos de PLN, visión mediante ordenador y aprendizaje automático.

Objetivo

Automatically translating human language has been a long sought-after goal in the field of Natural Language Processing (NLP). Machine Translation (MT) can significantly lower communication barriers, with enormous potential for positive social and economic impact. The dominant paradigm is Statistical Machine Translation (SMT), which learns to translate from human-translated examples.

Human translators have access to a number of contextual cues beyond the actual segment to translate when performing translation, for example images associated with the text and related documents. SMT systems, however, completely disregard any form of non-textual context and make little or no reference to wider surrounding textual content. This results in translations that miss relevant information or convey incorrect meaning. Such issues drastically affect reading comprehension and may make translations useless. This is especially critical for user-generated content such as social media posts -- which are often short and contain non-standard language -- but applies to a wide range of text types.

The novel and ambitious idea in this proposal is to devise methods and algorithms to exploit global multi-modal information for context modelling in SMT. This will require a significantly disruptive approach with new ways to acquire multilingual multi-modal representations, and new machine learning and inference algorithms that can process rich context models. The focus will be on three context types: global textual content from the document and related texts, visual cues from images and metadata including topic, date, author, source. As test beds, two challenging user-generated datasets will be used: Twitter posts and product reviews.

This highly interdisciplinary research proposal draws expertise from NLP, Computer Vision and Machine Learning and claims that appropriate modelling of multi-modal context is key to achieve a new breakthrough in SMT, regardless of language pair and text type.

Régimen de financiación

ERC-STG - Starting Grant

Institución de acogida

IMPERIAL COLLEGE OF SCIENCE TECHNOLOGY AND MEDICINE
Aportación neta de la UEn
€ 1 010 513,67
Dirección
SOUTH KENSINGTON CAMPUS EXHIBITION ROAD
SW7 2AZ LONDON
Reino Unido

Ver en el mapa

Región
London Inner London — West Westminster
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total
€ 1 010 513,67

Beneficiarios (2)