Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español es
CORDIS - Resultados de investigaciones de la UE
CORDIS

Assessing Training Data Filtering Strategies for the Reduction of Harms in AI

Objetivo

Large Language Models (LLMs) learn everything they know of the World from what they find in training datasets: if datasets include harmful content, it is more likely that they learn how to produce discriminating outputs. Therefore, reducing the presence of harmful contents in the input training dataset is a crucial step to develop safer and fairer technologies. However, the effectiveness of existing data filtering strategies for harm reduction is still an understudied topic in NLP research.
DISHARM's main research objective is to develop the first framework for the systematic evaluation of data filtering strategies with the goal of reducing harmful contents in training datasets. The project foresees the implementation of the first open leaderboard of data filtering strategies, which will enable a comparison of their effects in mitigating or exacerbating harms against different vulnerable identities. The leaderboard is implemented through a system that combines NLP and Semantic Web technologies for revealing which identities are the most discriminated against inside textual datasets and in particular, which are the types of harms that these vulnerable categories are subjected to. In recognizing the social implications of its research objectives, DISHARM will be co-designed through a community-centered approach: the effects of data filtering strategies on vulnerable identities will be evaluated in collaboration with Hate Trackers and Facing Facts, two networks of activists against discrimination who operate in 18 EU countries. DISHARM aligns closely with the objectives of the EU on the regulation of Artificial Intelligence, aiming to provide a new standard for the evaluation of data filtering strategies for LLM training data. This is expected to have a significant impact in the field of NLP studies on bias and fairness and in the actual implementation of legal obligations provided by the EU AI Act on the detection and mitigation of biases in datasets.

Ámbito científico (EuroSciVoc)

CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véas: El vocabulario científico europeo..

Para utilizar esta función, debe iniciar sesión o registrarse

Palabras clave

Palabras clave del proyecto indicadas por el coordinador del proyecto. No confundir con la taxonomía EuroSciVoc (Ámbito científico).

Programa(s)

Programas de financiación plurianuales que definen las prioridades de la UE en materia de investigación e innovación.

Tema(s)

Las convocatorias de propuestas se dividen en temas. Un tema define una materia o área específica para la que los solicitantes pueden presentar propuestas. La descripción de un tema comprende su alcance específico y la repercusión prevista del proyecto financiado.

Régimen de financiación

Régimen de financiación (o «Tipo de acción») dentro de un programa con características comunes. Especifica: el alcance de lo que se financia; el porcentaje de reembolso; los criterios específicos de evaluación para optar a la financiación; y el uso de formas simplificadas de costes como los importes a tanto alzado.

HORIZON-TMA-MSCA-PF-EF - HORIZON TMA MSCA Postdoctoral Fellowships - European Fellowships

Ver todos los proyectos financiados en el marco de este régimen de financiación

Convocatoria de propuestas

Procedimiento para invitar a los solicitantes a presentar propuestas de proyectos con el objetivo de obtener financiación de la UE.

(se abrirá en una nueva ventana) HORIZON-MSCA-2025-PF

Ver todos los proyectos financiados en el marco de esta convocatoria

Coordinador

IT-UNIVERSITETET I KOBENHAVN
Aportación neta de la UEn

Aportación financiera neta de la UE. Es la suma de dinero que recibe el participante, deducida la aportación de la UE a su tercero vinculado. Considera la distribución de la aportación financiera de la UE entre los beneficiarios directos del proyecto y otros tipos de participantes, como los terceros participantes.

€ 263 393,28
Dirección
RUED LANGGAARDSVEJ 7
2300 KOBENHAVN
Dinamarca

Ver en el mapa

Región
Danmark Hovedstaden Byen København
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total

Los costes totales en que ha incurrido esta organización para participar en el proyecto, incluidos los costes directos e indirectos. Este importe es un subconjunto del presupuesto total del proyecto.

Sin datos
Mi folleto 0 0