Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Fairness in Language Models: Equally right for the right reasons

Descripción del proyecto

Investigación de la imparcialidad en los modelos de lenguaje que utilizan las aplicaciones para comprender el lenguaje

El procesamiento del lenguaje natural (PLN) permite que los dispositivos digitales analicen, comprendan y sinteticen el lenguaje humano, ya sea texto o voz. La mayoría de los sistemas se basan en modelos de lenguaje que emplean grandes corpus de datos de entrenamiento obtenidos de forma automática de fuentes de internet. Sin embargo, esto los hace vulnerables a prejuicios, estereotipos y exclusiones injustificados. En el proyecto FairER, financiado con fondos europeos, se investigarán modelos de lenguaje de PLN y estrategias de solución en un contexto multilingüe. Sus investigadores determinarán su objetividad e inclusividad, no solo en términos demográficos (por ejemplo, la raza, el género, la edad), sino también a nivel de alfabetización. Se espera que este trabajo haga que las aplicaciones de PLN sean más equitativas y que sirva de base para nuevas investigaciones.

Objetivo

Most of us use technology related to natural language processing (NLP) such as Google Search or virtual assistants in phones and other devices on a daily basis. Large-scale pre-trained language models hereby play a crucial role as they often form the basis of those technologies. Those models are trained on a large amount of training data (e.g. the entire English Wikipedia and the Brown corpus) which makes it impossible to curate the training corpus and potential stereotypes and biases will be implemented into the model, often without researchers noticing. This can lead to problematic and unfair behaviour towards certain demographics, often those who already suffer from implicit biases in society.

With FairER, I aim to get a deeper understanding of the inner workings of these language models. In particular, I want to investigate how well their solution strategies align with those of humans and whether this depends on certain demographic attributes such as gender, race, age but also reading abilities and level of education. I will also probe those language models for fairness and inclusiveness, i.e. find out whether the performance of an NLP application depends on demographic attributes of the user. Furthermore, I will conduct this project in a multilingual setting and apply interpretability methods to better understand the rationale behind a models decision.

The main impact of FairER will be a better understanding of how language models treat different demographics. These insights will help to improve the fairness and inclusiveness of NLP applications. Furthermore, the datasets I will record and publish along with the code will encourage other researchers to replicate my findings and continue this line of research. Ultimately, this project will have both a scientific and societal impact on the NLP community and users of NLP applications.

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-TMA-MSCA-PF-EF - HORIZON TMA MSCA Postdoctoral Fellowships - European Fellowships

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) HORIZON-MSCA-2021-PF-01

Ver todos los proyectos financiados en el marco de esta convocatoria

Coordinador

KOBENHAVNS UNIVERSITET
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 214 934,40
Dirección
NORREGADE 10
1165 KOBENHAVN
Dinamarca

Ver en el mapa

Región
Danmark Hovedstaden Byen København
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

Sin datos
Mi folleto 0 0