Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español es
CORDIS - Resultados de investigaciones de la UE
CORDIS

Towards globally accessible language technology and its alignment to cultural contexts

Descripción del proyecto

Avance de la tecnología de procesamiento multilingüe del lenguaje natural

Los grandes modelos lingüísticos (LLM), como ChatGPT, ampliamente adoptados en diversos sectores, se basan en la tecnología de procesamiento del lenguaje natural (PLN) para generar respuestas fluidas a partir de instrucciones en lenguaje natural. Sin embargo, tanto los LLM como otras aplicaciones basadas en la PLN se han limitado en gran medida a unos pocos idiomas debido a la gran cantidad de datos lingüísticos necesarios para su entrenamiento. El proyecto CulturAL, financiado por el Consejo Europeo de Investigación, pretende superar esta barrera desarrollando una metodología innovadora para la transferencia translingüística de los LLM, que permita su adaptación a una amplia gama de lenguas, dialectos y contextos culturales.

Objetivo

My research project focuses on natural language processing (NLP), an area of artificial intelligence concerned with automatic interpretation and generation of human language. NLP is well-known for its widely-used applications, such as machine translation (MT), text mining, question answering or dialogue systems. Much of this technology is now powered by large language models (LLMs), such as ChatGPT, which take a natural language instruction or question as input, and generate a fluent response. Due to their impressive performance in a range of tasks and their ease of use, in less than a year they received a wide adoption in many societal contexts (education, journalism, healthcare and others), and became the central paradigm in the field of NLP.

The development of LLMs, however, requires access to a vast amount of data and resources in a given language, as well as considerable computational infrastructure. As a result, these models are in practice limited to a handful of widely-spoken languages, leaving over 6,000 of the world’s languages and dialects without access to language technology. Furthermore, research on LLM alignment, which aims to ensure the safety of their use, has been almost exclusively directed toward the English-speaking world. Taken together, these problems lead to a major inequity in today’s language technology and artificial intelligence more broadly.

Taking a step towards a more inclusive and equitable language technology, this project will develop a novel methodology for cross-lingual transfer of LLMs to a wide-range of (low-resource, understudied) languages and dialects, and their alignment to diverse cultural contexts. The project will, therefore, advance multilingual NLP technology, extending its reach to populations currently underserved by NLP and making it safe for them to use.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-ERC - HORIZON ERC Grants

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) ERC-2024-COG

Ver todos los proyectos financiados en el marco de esta convocatoria

Institución de acogida

UNIVERSITEIT VAN AMSTERDAM
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 1 998 926,00
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

€ 1 998 926,25

Beneficiarios (1)

Mi folleto 0 0