Opis projektu
Innowacyjna technologia wpisuje się w bogaty wachlarz rozwiązań europejskiej sieci językowej
Finansowany ze środków UE projekt HPLT zajmuje się zastosowaniem wysokosprawnych metod obliczeniowych do skalowania i rozwijania technologii językowych. Dzięki najnowszym osiągnięciom z dziedziny uczenia maszynowego i zdumiewającym zdolnościom do przechowywania, zespół projektu wyprodukuje i przetworzy olbrzymie zbiory danych językowych oraz opracuje modele językowe i tłumaczeniowe dla wielu języków. Nowe modele zostaną przetestowane pod różnymi kątami, aby zapewnić ich bezproblemową integrację, wysoką dokładność i zgodność z przepisami dotyczącymi prywatności, braku stronniczości i zasadami etyki. Modele i zestawy danych będą przełomem na rynku usług językowych w UE i poza jej granicami. Będę one otwarte, darmowe i dostępne z poziomu istniejących repozytoriów językowych dla każdego, kogo interesują projekty badawcze lub innowacje.
Cel
High Performance Language Technologies (HPLT) is a space combining petabytes of natural language data with large-scale model training. With trillions of words of text, the space will be the largest open text collection. Cleaning and privacy protecting services improve the quality and ethical properties of the text. Going beyond static repositories that require the user to individually analyze each data set, the project will rate data sets by how much they improve end-to-end language models and machine translation systems. Continuous integration of models and data will result in free downloadable high-quality models for all official European Union languages and beyond. The models will be reproducible with information and evaluation metrics shown in a publicly available dashboard. By focusing on training at scale, the project complements the inference-focused European Language Grid, which in turn will be used for model deployment. Datasets, models and information about them will be published in recognized FAIR data repositories, aggregation catalogues and marketplaces for easy discovery, access, replication, and exploitation.
Dziedzina nauki
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
Słowa kluczowe
Program(-y)
Zaproszenie do składania wniosków
Zobacz inne projekty w ramach tego zaproszeniaSystem finansowania
HORIZON-IA - HORIZON Innovation ActionsKoordynator
116 36 Praha 1
Czechy