Descrizione del progetto
Filtraggio automatico dei contenuti per combattere le fake news
L’elaborazione del linguaggio naturale e l’apprendimento automatico sono considerati contromisure per combattere la disinformazione e le sfide a essa associate. Ad esempio, le soluzioni basate sull’elaborazione del linguaggio naturale sono in grado di segnalare le notizie false, i bot dei social media e l’utilizzo di tecniche di propaganda. Ma come gestire la cattiva informazione diffusa in modo intenzionale, pubblicata con modalità in grado di ingannare qualsiasi algoritmo di filtraggio automatico? Il progetto ERINIA, finanziato dall’UE, approfondirà i metodi di rilevamento degli esempi contraddittori e studierà la solidità dei classificatori di testi. I risultati del progetto saranno diffusi nelle comunità di ricerca al fine di stimolare ulteriori dibattiti sull’impiego del filtraggio automatico dei contenuti nella lotta contro la disinformazione.
Obiettivo
As challenges posed by misinformation become apparent in the modern digital society, state-of-the-art methods of Artificial Intelligence, especially Natural Language Processing (NLP) and Machine Learning, are considered as countermeasures. Indeed, previous research has shown that NLP solutions can detect phenomena such as fake news, social media bots or usage of propaganda techniques. However, little attention has been given to the robustness of these approaches, which is especially important in the case of deliberate misinformation, whose authors would likely attempt to deceive any automatic filtering algorithm to achieve their goals.
The goal of the ERINIA project is to explore the robustness of text classifiers in this application area by investigating methods for detecting adversarial examples. Such methods aim to perform small perturbations to a given text piece, so that its meaning is preserved, but the output of the investigated classifier is reversed. To that end, previously unexplored directions will be pursued, including training reinforcement learning solutions and leveraging research on simplification and style transfer. Finally, the developed tools will be used to check the robustness of the current state-of-the-art misinformation detection solutions.
The project includes a range of training activities for the researcher and a plan for dissemination of the obtained results to various research communities. It also takes into account the society at large, as the project outcomes can inform further discussion on whether automatic content filtering is a viable solution to the misinformation problem.
Campo scientifico
Programma(i)
- HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) Main Programme
Meccanismo di finanziamento
HORIZON-AG-UN - HORIZON Unit GrantCoordinatore
08002 Barcelona
Spagna