Skip to main content
European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Evaluating the Robustness of Non-Credible Text Identification by Anticipating Adversarial Actions

Opis projektu

Automatyczne filtrowanie treści w walce z dezinformacją

Przetwarzanie języka naturalnego (ang. natural language processing, NLP) oraz uczenie maszynowe to technologie, które mogą skutecznie przeciwdziałać dezinformacji i pomagać w rozwiązywaniu powiązanym z nią wyzwań. Na przykład, rozwiązania z zakresu NLP pozwalają oznaczać fałszywe informacje, boty w mediach społecznościowych oraz użycie technik propagandy. Co jednak z celową dezinformacją, której treść jest publikowana w sposób, który zwodzi algorytmy automatycznej filtracji? Badacze z finansowanego ze środków UE projektu ERINIA przyjrzą się metodom wykrywania przykładów kontradyktoryjnych i zbadają niezawodność klasyfikatorów tekstu. Ustalenia zespołu projektu zostaną rozpowszechnione wśród społeczności badaczy z myślą o zainicjowaniu dalszej dyskusji na temat użycia automatycznych filtrów treści w walce przeciwko dezinformacji.

Cel

As challenges posed by misinformation become apparent in the modern digital society, state-of-the-art methods of Artificial Intelligence, especially Natural Language Processing (NLP) and Machine Learning, are considered as countermeasures. Indeed, previous research has shown that NLP solutions can detect phenomena such as fake news, social media bots or usage of propaganda techniques. However, little attention has been given to the robustness of these approaches, which is especially important in the case of deliberate misinformation, whose authors would likely attempt to deceive any automatic filtering algorithm to achieve their goals.

The goal of the ERINIA project is to explore the robustness of text classifiers in this application area by investigating methods for detecting adversarial examples. Such methods aim to perform small perturbations to a given text piece, so that its meaning is preserved, but the output of the investigated classifier is reversed. To that end, previously unexplored directions will be pursued, including training reinforcement learning solutions and leveraging research on simplification and style transfer. Finally, the developed tools will be used to check the robustness of the current state-of-the-art misinformation detection solutions.

The project includes a range of training activities for the researcher and a plan for dissemination of the obtained results to various research communities. It also takes into account the society at large, as the project outcomes can inform further discussion on whether automatic content filtering is a viable solution to the misinformation problem.

Koordynator

UNIVERSIDAD POMPEU FABRA
Wkład UE netto
€ 165 312,96
Adres
PLACA DE LA MERCE, 10-12
08002 Barcelona
Hiszpania

Zobacz na mapie

Region
Este Cataluña Barcelona
Rodzaj działalności
Higher or Secondary Education Establishments
Linki
Koszt całkowity
Brak danych