Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano it
CORDIS - Risultati della ricerca dell’UE
CORDIS

Towards globally accessible language technology and its alignment to cultural contexts

Descrizione del progetto

Progressi nella tecnologia di elaborazione del linguaggio naturale multilingue

I modelli linguistici di grandi dimensioni (LLM), come ChatGPT, sono ampiamente adottati in vari settori e si basano sulla tecnologia di elaborazione del linguaggio naturale (ELN) per generare risposte fluenti da istruzioni impartite in linguaggio naturale; ciononostante, sia gli LLM che altre applicazioni basate sull’ELN si sono in gran parte limitati a poche lingue a causa della grande quantità di dati linguistici necessari al loro addestramento. Il progetto CulturAL, finanziato dal CER, si propone di superare questa barriera sviluppando un’innovativa metodologia per il trasferimento interlinguistico degli LLM, consentendone l’adattamento a una vasta gamma di lingue, dialetti e contesti culturali.

Obiettivo

My research project focuses on natural language processing (NLP), an area of artificial intelligence concerned with automatic interpretation and generation of human language. NLP is well-known for its widely-used applications, such as machine translation (MT), text mining, question answering or dialogue systems. Much of this technology is now powered by large language models (LLMs), such as ChatGPT, which take a natural language instruction or question as input, and generate a fluent response. Due to their impressive performance in a range of tasks and their ease of use, in less than a year they received a wide adoption in many societal contexts (education, journalism, healthcare and others), and became the central paradigm in the field of NLP.

The development of LLMs, however, requires access to a vast amount of data and resources in a given language, as well as considerable computational infrastructure. As a result, these models are in practice limited to a handful of widely-spoken languages, leaving over 6,000 of the world’s languages and dialects without access to language technology. Furthermore, research on LLM alignment, which aims to ensure the safety of their use, has been almost exclusively directed toward the English-speaking world. Taken together, these problems lead to a major inequity in today’s language technology and artificial intelligence more broadly.

Taking a step towards a more inclusive and equitable language technology, this project will develop a novel methodology for cross-lingual transfer of LLMs to a wide-range of (low-resource, understudied) languages and dialects, and their alignment to diverse cultural contexts. The project will, therefore, advance multilingual NLP technology, extending its reach to populations currently underserved by NLP and making it safe for them to use.

Campo scientifico (EuroSciVoc)

CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.

È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione

Programma(i)

Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.

Argomento(i)

Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.

Meccanismo di finanziamento

Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.

HORIZON-ERC - HORIZON ERC Grants

Vedi tutti i progetti finanziati nell’ambito di questo schema di finanziamento

Invito a presentare proposte

Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.

(si apre in una nuova finestra) ERC-2024-COG

Vedi tutti i progetti finanziati nell’ambito del bando

Istituzione ospitante

UNIVERSITEIT VAN AMSTERDAM
Contributo netto dell'UE

Contributo finanziario netto dell’UE. La somma di denaro che il partecipante riceve, decurtata dal contributo dell’UE alla terza parte collegata. Tiene conto della distribuzione del contributo finanziario dell’UE tra i beneficiari diretti del progetto e altri tipi di partecipanti, come i partecipanti terzi.

€ 1 998 926,00
Costo totale

I costi totali sostenuti dall’organizzazione per partecipare al progetto, compresi i costi diretti e indiretti. Questo importo è un sottoinsieme del bilancio complessivo del progetto.

€ 1 998 926,25

Beneficiari (1)

Il mio fascicolo 0 0