Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch de
CORDIS - Forschungsergebnisse der EU
CORDIS

A prototype system for obtaining and managing training data for multilingual learning

CORDIS bietet Links zu öffentlichen Ergebnissen und Veröffentlichungen von HORIZONT-Projekten.

Links zu Ergebnissen und Veröffentlichungen von RP7-Projekten sowie Links zu einigen Typen spezifischer Ergebnisse wie Datensätzen und Software werden dynamisch von OpenAIRE abgerufen.

Leistungen

Veröffentlichungen

EXECUTE: A Multilingual Benchmark for LLM Token Understanding (öffnet in neuem Fenster)

Autoren: Lukas Edman, Helmut Schmid, Alexander Fraser
Veröffentlicht in: Findings of the Association for Computational Linguistics: ACL 2025, 2025
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/V1/2025.FINDINGS-ACL.95

From Unaligned to Aligned: Scaling Multilingual LLMs with Multi-Way Parallel Corpora (öffnet in neuem Fenster)

Autoren: Yingli Shen, Wen Lai, Shuo Wang, Ge Gao, Kangyang Luo, Alexander Fraser, Maosong Sun
Veröffentlicht in: Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, 2025
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/V1/2025.EMNLP-MAIN.374

Improving Parallel Sentence Mining for Low-Resource and Endangered Languages (öffnet in neuem Fenster)

Autoren: Shu Okabe, Katharina Hämmerl, Alexander Fraser
Veröffentlicht in: Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 2025
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/V1/2025.ACL-SHORT.17

Mask and You Shall Receive: Optimizing Masked Language Modeling For Pretraining BabyLMs (öffnet in neuem Fenster)

Autoren: Lukas Edman, Alexander Fraser
Veröffentlicht in: Proceedings of the First BabyLM Workshop, 2025
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/V1/2025.BABYLM-MAIN.31

Findings of the WMT 2025 Shared Task LLMs with Limited Resources for Slavic Languages: MT and QA (öffnet in neuem Fenster)

Autoren: Shu Okabe, Daryna Dementieva, Marion Di Marco, Lukas Edman, Katharina Haemmerl, Marko Měškank, Anita Hendrichowa, Alexander Fraser
Veröffentlicht in: Proceedings of the Tenth Conference on Machine Translation, 2025
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/V1/2025.WMT-1.27

Suche nach OpenAIRE-Daten ...

Bei der Suche nach OpenAIRE-Daten ist ein Fehler aufgetreten

Es liegen keine Ergebnisse vor

Mein Booklet 0 0