Skip to main content
CORDIS - Forschungsergebnisse der EU
CORDIS

High Performance Language Technologies

Projektbeschreibung

Innovative Technologie für die Fülle des europäischen Sprachennetzes

Das EU-finanzierte Projekt HPLT setzt Hochleistungsrechner ein, um Sprachtechnologien auszubauen und weiterzuentwickeln. Es nutzt die Vorteile neuerer Fortschritte des maschinellen Lernens und die erstaunlichen Speicherkapazitäten aus, um riesige Sprachdatensätze zu erstellen und zu verarbeiten. So sollen Sprach- und Übersetzungsmodelle in vielen verschiedenen Sprachen generiert werden. Die erstellten Modelle werden aus verschiedenen Winkeln betrachtet, um eine nahtlose Integration, hohe Präzision und die Erfüllung gesetzlicher Bestimmungen bezüglich Datenschutz, ungewollter Voreingenommenheit und moralischen Bedenken sicherzustellen. Die Modelle und Datensätze werden den Markt der Sprachdienstleistungen in der EU und anderen Regionen merklich verändern. Sie sollen offen, frei und über alle bekannten Sprachbestände verfügbar sein für alle, die Forschungs- oder Innovationsprojekte bearbeiten wollen.

Ziel

High Performance Language Technologies (HPLT) is a space combining petabytes of natural language data with large-scale model training. With trillions of words of text, the space will be the largest open text collection. Cleaning and privacy protecting services improve the quality and ethical properties of the text. Going beyond static repositories that require the user to individually analyze each data set, the project will rate data sets by how much they improve end-to-end language models and machine translation systems. Continuous integration of models and data will result in free downloadable high-quality models for all official European Union languages and beyond. The models will be reproducible with information and evaluation metrics shown in a publicly available dashboard. By focusing on training at scale, the project complements the inference-focused European Language Grid, which in turn will be used for model deployment. Datasets, models and information about them will be published in recognized FAIR data repositories, aggregation catalogues and marketplaces for easy discovery, access, replication, and exploitation.

Koordinator

UNIVERZITA KARLOVA
Netto-EU-Beitrag
€ 641 812,50
Adresse
OVOCNY TRH 560/5
116 36 Praha 1
Tschechien

Auf der Karte ansehen

Region
Česko Praha Hlavní město Praha
Aktivitätstyp
Higher or Secondary Education Establishments
Links
Gesamtkosten
€ 641 812,50

Beteiligte (6)

Partner (1)