Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Responsive classifiers against hate speech in low-resource settings

Descrizione del progetto

Estendere il filtro dei discorsi d’odio alle regioni a bassa densità di risorse

Nell’era dei social media, quello dei discorsi d’odio è diventato un problema globale allarmante. Sebbene i giganti della tecnologia impieghino modelli di apprendimento automatico per filtrare tali contenuti, la maggior parte delle lingue rimane poco servita a causa della mancanza di dati di addestramento. In questo contesto, il progetto Respond2Hate, finanziato dal CER, svilupperà modelli di rappresentazione multilingue. L’obiettivo è quello di creare un’estensione browser di facile utilizzo, che consenta alle persone di eliminare in modo indipendente e locale i contenuti di odio dai loro feed di social media. In particolare, Respond2Hate si concentra sullo sviluppo di modelli agili e adattivi che richiedono un minimo di dati di addestramento iniziale, utilizzando tecniche all’avanguardia di elaborazione del linguaggio naturale e di apprendimento profondo. Estendendo il filtro dei discorsi d’odio alle regioni a basse risorse, spesso trascurate da governi e ONG, il progetto consente agli utenti di curare la propria esperienza online.

Obiettivo

"Hate speech is a worldwide phenomenon that is increasingly pervading online spaces, creating an unsafe environment for users. While tech companies address this problem by server-side filtering using machine learning models trained on large datasets, these automatic methods cannot be applied to most languages due to lack of available training data.

Based on recent results of the PI's ERC project on multilingual representation models in low-resource settings, Respond2Hate aims at developing a pilot browser extension that allows users to locally remove hateful content from their social media feeds themselves, without having to rely on the support of tech companies.

Since hate speech is highly dependent on cultural context, responsive classifiers are needed that adapt to the individual environment. Commercial efforts focus on large-scale, general-purpose models which are often burdened with representation and bias problems, and therefore cope poorly with swiftly changing targets or information shift between regional contexts. In contrast, we seek to develop lightweight, adaptive models that require only a small dataset for initial fine-tuning by continuously enhancing model capabilities over time.

This is achieved by applying state-of-the-art Natural Language Processing (NLP) and deep learning techniques for pre-trained language models like low-resource transfer of hate speech representations from high-resource languages and few-shot learning based on limited user feedback. We have already successfully applied these methods in low-resource multilingual settings, and will now validate their use for hate speech filtering.

By making hate speech detection and reduction available in ""low-resource"" countries with little representation in current training datasets, which are currently not served well by governments, industry and NGOs, Respond2Hate will empower users to self-control their exposure to hate speech, fostering a healthier and safer online environment."

Meccanismo di finanziamento

HORIZON-ERC-POC -

Istituzione ospitante

LUDWIG-MAXIMILIANS-UNIVERSITAET MUENCHEN
Contributo netto dell'UE
€ 150 000,00
Indirizzo
GESCHWISTER SCHOLL PLATZ 1
80539 MUNCHEN
Germania

Mostra sulla mappa

Regione
Bayern Oberbayern München, Kreisfreie Stadt
Tipo di attività
Istituti di istruzione secondaria o superiore
Collegamenti
Costo totale
Nessun dato

Beneficiari (1)