Opis projektu
Rozwój wielojęzycznej technologii przetwarzania języka naturalnego
Duże modele językowe (LLM), takie jak ChatGPT, które zostały szeroko przyjęte w różnych sektorach, wykorzystują technologię przetwarzania języka naturalnego (NLP) do generowania płynnych odpowiedzi na instrukcje w języku naturalnym. Jednak zarówno LLM, jak i aplikacje wykorzystujące NLP były w dużej mierze ograniczone do kilku języków ze względu na ogromne ilości danych językowych wymaganych do ich szkolenia. Projekt CulturAL finansowany przez ERBN ma na celu pokonanie tych przeszkód, opracowując innowacyjną metodologię dla ponadjęzykowego transferu LLM, aby umożliwić ich dostosowanie do szerokiej gamy języków, dialektów i kontekstów kulturowych.
Cel
My research project focuses on natural language processing (NLP), an area of artificial intelligence concerned with automatic interpretation and generation of human language. NLP is well-known for its widely-used applications, such as machine translation (MT), text mining, question answering or dialogue systems. Much of this technology is now powered by large language models (LLMs), such as ChatGPT, which take a natural language instruction or question as input, and generate a fluent response. Due to their impressive performance in a range of tasks and their ease of use, in less than a year they received a wide adoption in many societal contexts (education, journalism, healthcare and others), and became the central paradigm in the field of NLP.
The development of LLMs, however, requires access to a vast amount of data and resources in a given language, as well as considerable computational infrastructure. As a result, these models are in practice limited to a handful of widely-spoken languages, leaving over 6,000 of the world’s languages and dialects without access to language technology. Furthermore, research on LLM alignment, which aims to ensure the safety of their use, has been almost exclusively directed toward the English-speaking world. Taken together, these problems lead to a major inequity in today’s language technology and artificial intelligence more broadly.
Taking a step towards a more inclusive and equitable language technology, this project will develop a novel methodology for cross-lingual transfer of LLMs to a wide-range of (low-resource, understudied) languages and dialects, and their alignment to diverse cultural contexts. The project will, therefore, advance multilingual NLP technology, extending its reach to populations currently underserved by NLP and making it safe for them to use.
Dziedzina nauki (EuroSciVoc)
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego. Więcej informacji: Europejski Słownik Naukowy.
Aby użyć tej funkcji, musisz się zalogować lub zarejestrować
Program(-y)
Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.
Wieloletnie programy finansowania, które określają priorytety Unii Europejskiej w obszarach badań naukowych i innowacji.
-
HORIZON.1.1 - European Research Council (ERC)
GŁÓWNY PROGRAM
Wyświetl wszystkie projekty finansowane w ramach tego programu
Temat(-y)
Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.
Zaproszenia do składania wniosków dzielą się na tematy. Każdy temat określa wybrany obszar lub wybrane zagadnienie, których powinny dotyczyć wnioski składane przez wnioskodawców. Opis tematu obejmuje jego szczegółowy zakres i oczekiwane oddziaływanie finansowanego projektu.
System finansowania
Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.
Program finansowania (lub „rodzaj działania”) realizowany w ramach programu o wspólnych cechach. Określa zakres finansowania, stawkę zwrotu kosztów, szczegółowe kryteria oceny kwalifikowalności kosztów w celu ich finansowania oraz stosowanie uproszczonych form rozliczania kosztów, takich jak rozliczanie ryczałtowe.
HORIZON-ERC - HORIZON ERC Grants
Wyświetl wszystkie projekty finansowane w ramach tego programu finansowania
Zaproszenie do składania wniosków
Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.
Procedura zapraszania wnioskodawców do składania wniosków projektowych w celu uzyskania finansowania ze środków Unii Europejskiej.
(odnośnik otworzy się w nowym oknie) ERC-2024-COG
Wyświetl wszystkie projekty finansowane w ramach tego zaproszeniaInstytucja przyjmująca
Kwota netto dofinansowania ze środków Unii Europejskiej. Suma środków otrzymanych przez uczestnika, pomniejszona o kwotę unijnego dofinansowania przekazanego powiązanym podmiotom zewnętrznym. Uwzględnia podział unijnego dofinansowania pomiędzy bezpośrednich beneficjentów projektu i pozostałych uczestników, w tym podmioty zewnętrzne.
1012WX Amsterdam
Niderlandy
Ogół kosztów poniesionych przez organizację w związku z uczestnictwem w projekcie. Obejmuje koszty bezpośrednie i pośrednie. Kwota stanowi część całkowitego budżetu projektu.