Skip to main content
European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

High Performance Language Technologies

Descrizione del progetto

Una tecnologia innovativa si aggiunge all’arsenale di risorse della rete linguistica europea

Il progetto HPLT, finanziato dall’UE, applica il calcolo ad alte prestazioni per ampliare e migliorare le tecnologie linguistiche. Sfruttando i recenti progressi compiuti nel campo dell’apprendimento automatico e le straordinarie capacità di archiviazione, HPLT produrrà ed elaborerà set di dati linguistici di grandi dimensioni, nonché modelli traduttivi e linguistici in una vasta gamma di lingue. I modelli risultanti verranno collaudati da diverse angolazioni al fine di garantire un’integrazione ottimale, una precisione elevata e la conformità normativa per quanto concerne la privacy, i pregiudizi indesiderati e le questioni di tipo etico. I modelli e i set di dati risulteranno rivoluzionari nel mercato dei servizi linguistici dell’UE e non solo. I modelli conseguenti saranno aperti, liberi e disponibili presso noti archivi linguistici per chiunque sia interessato a dedicarsi a progetti di ricerca o innovazione.

Obiettivo

High Performance Language Technologies (HPLT) is a space combining petabytes of natural language data with large-scale model training. With trillions of words of text, the space will be the largest open text collection. Cleaning and privacy protecting services improve the quality and ethical properties of the text. Going beyond static repositories that require the user to individually analyze each data set, the project will rate data sets by how much they improve end-to-end language models and machine translation systems. Continuous integration of models and data will result in free downloadable high-quality models for all official European Union languages and beyond. The models will be reproducible with information and evaluation metrics shown in a publicly available dashboard. By focusing on training at scale, the project complements the inference-focused European Language Grid, which in turn will be used for model deployment. Datasets, models and information about them will be published in recognized FAIR data repositories, aggregation catalogues and marketplaces for easy discovery, access, replication, and exploitation.

Meccanismo di finanziamento

HORIZON-IA - HORIZON Innovation Actions

Coordinatore

UNIVERZITA KARLOVA
Contribution nette de l'UE
€ 641 812,50
Indirizzo
OVOCNY TRH 560/5
116 36 Praha 1
Cechia

Mostra sulla mappa

Regione
Česko Praha Hlavní město Praha
Tipo di attività
Higher or Secondary Education Establishments
Collegamenti
Costo totale
€ 641 812,50

Partecipanti (6)

Partner (1)