Incorporating Demographic Factors into Natural Language Processing Models

Informacje na temat projektu

INTEGRATOR

Identyfikator umowy o grant: 949944

Strona internetowa projektu

DOI

10.3030/949944

Data podpisania przez KE 13 Listopada 2020

Data rozpoczęcia 1 Marca 2021

Data zakończenia 31 Sierpnia 2026

Finansowanie w ramach

EXCELLENT SCIENCE - European Research Council (ERC)

Koszt całkowity

€ 1 498 937,00

Wkład UE

€ 1 498 937,00

1 498 937,00

Koordynowany przez

UNIVERSITA COMMERCIALE LUIGI BOCCONI
Italy

Opis projektu

Włączenie danych demograficznych do technologii przetwarzania języka

Opracowanie technologii przetwarzania języka uwzględniającej czynniki demograficzne stanowi nie lada wyzwanie. Zmierzyć się z nim zamierza zespół finansowanego przez UE projektu INTEGRATOR, który w tym celu opracuje nowe zestawy danych, teorie i algorytmy pozwalające na włączenie czynników demograficznych do technologii przetwarzania języka, co poprawi wydajność istniejących narzędzi, ograniczy obciążenie demograficzne i otworzy furtkę do nowych zastosowań. Obecnie wykorzystywana technologia przetwarzania języka naturalnego pomija czynniki demograficzne, zarówno w rozumieniu języka (np. podczas analizy sentymentu), jak i jego generowaniu. Odbija się to na jakości przetwarzania, co ogranicza możliwości przyszłego zastosowania tych rozwiązań i przyczynia się do powstania błędu systematycznego dotyczącego niedostatecznie reprezentowanych grup.

Cel

The goal of INTEGRATOR is to develop novel data sets, theories, and algorithms to incorporate demographic factors into language technology. This will improve performance of existing tools for all users, reduce demographic bias, and enable completely new applications.
Language reflects demographic factors like our age, gender, etc. People actively use this information to make inferences, but current language technology (NLP) fails to account for demographics, both in language understanding (e.g. sentiment analysis) and generation (e.g. chatbots). This failure prevents us from reaching human-like performance, limits possible future applications, and introduces systematic bias against underrepresented demographic groups.
Solving demographic bias is one of the greatest challenges for current language technology. Failing to do so will limit the field and harm public trust in it. Bias in AI systems recently emerged as a severe problem for privacy, fairness, and ethics of AI. It is especially prevalent in language technology, due to language's rich demographic information. Since NLP is ubiquitous (translation, search, personal assistants, etc.), demographically biased models creates uneven access to vital technology.
Despite increased interest in demographics in NLP, there are no concerted efforts to integrate it: no theory, data sets, or algorithmic solutions. INTEGRATOR will address these by identifying which demographic factors affect NLP systems, devising a bias taxonomy and metrics, and creating new data. These will enable us to use transfer and reinforcement learning methods to build demographically aware input representations and systems that incorporate demographics to improve performance and reduce bias.
Demographically aware NLP will lead to high-performing, fair systems for text analysis and generation. This ground-breaking research advances our understanding of NLP, algorithmic fairness, and bias in AI, and creates new research resources and avenues.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.

nauki przyrodnicze informatyka nauka o danych przetwarzanie języka naturalnego

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

H2020-EU.1.1. - EXCELLENT SCIENCE - European Research Council (ERC) GŁÓWNY PROGRAM
Wyświetl wszystkie projekty finansowane w ramach tego programu

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

ERC-2020-STG - ERC STARTING GRANTS
Wyświetl wszystkie projekty finansowane w ramach tego zagadnienia

System finansowania

Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.

ERC-STG - Starting Grant

Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

(odnośnik otworzy się w nowym oknie) ERC-2020-STG

Wyświetl wszystkie projekty finansowane w ramach tego zaproszenia

Instytucja przyjmująca

UNIVERSITA COMMERCIALE LUIGI BOCCONI

Wkład UE netto

€ 1 498 937,00

Adres

VIA SARFATTI 25
20136 Milano
Włochy

Region

Nord-Ovest Lombardia Milano

Rodzaj działalności

Higher or Secondary Education Establishments

Linki

Kontakt z organizacją

Strona internetowa

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 1 498 937,00

Beneficjenci (1)

UNIVERSITA COMMERCIALE LUIGI BOCCONI

Włochy

Wkład UE netto

€ 1 498 937,00

Opis projektu

Włączenie danych demograficznych do technologii przetwarzania języka

Cel

Słowa kluczowe Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y) Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y) Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.

Instytucja przyjmująca

Beneficjenci (1)

Pobierz Pobierz zawartość strony

Słowa kluczowe

Słowa kluczowe dotyczące projektu wybrane przez koordynatora projektu. Nie należy mylić ich z pojęciami z taksonomii EuroSciVoc dotyczącymi dziedzin nauki.

Program(-y)

Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.

Temat(-y)

Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.

Zaproszenie do składania wniosków

Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.