Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

High Performance Language Technologies

CORDIS oferuje możliwość skorzystania z odnośników do publicznie dostępnych publikacji i rezultatów projektów realizowanych w ramach programów ramowych HORYZONT.

Odnośniki do rezultatów i publikacji związanych z poszczególnymi projektami 7PR, a także odnośniki do niektórych konkretnych kategorii wyników, takich jak zbiory danych i oprogramowanie, są dynamicznie pobierane z systemu OpenAIRE .

Rezultaty

Initial release of monolingual and parallel data sets (odnośnik otworzy się w nowym oknie)

This deliverable consists of initial set of textual data acquired from web and non-web sources, both in monolingual and parallel parts, after cleaning done in WP2.

Software for cleaning data sets (odnośnik otworzy się w nowym oknie)

Free and open-source software will be released on GitHub.

First language models trained (odnośnik otworzy się w nowym oknie)

Language models will be made available for download however it may not have all or the cleanest data.

Translation models for select language pairs (odnośnik otworzy się w nowym oknie)

Models available for download trained using the pipeline.

Publikacje

Four Approaches to Low-Resource Multilingual NMT: The Helsinki Submission to the AmericasNLP 2023 Shared Task (odnośnik otworzy się w nowym oknie)

Autorzy: Ona De Gibert, Raúl Vázquez, Mikko Aulamo, Yves Scherrer, Sami Virpioja, Jörg Tiedemann
Opublikowane w: 2023, ISBN 978-1-959429-91-3
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.AMERICASNLP-1.20

CUNI Systems for the WMT22 Czech-Ukrainian Translation Task (odnośnik otworzy się w nowym oknie)

Autorzy: Popel, Martin; Libovický, Jindřich; Helcl, Jindřich
Opublikowane w: 2022, ISBN 978-1-959429-29-6
Wydawca: Association for Computational Linguistics
DOI: 10.48550/ARXIV.2212.00486

PMIndiaSum: Multilingual and Cross-lingual Headline Summarization for Languages in India (odnośnik otworzy się w nowym oknie)

Autorzy: Ashok Urlana, Pinzhen Chen, Zheng Zhao, Shay Cohen, Manish Shrivastava, Barry Haddow
Opublikowane w: 2023, ISBN 979-8-89176-061-5
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.FINDINGS-EMNLP.777

Towards Effective Disambiguation for Machine Translation with Large Language Models (odnośnik otworzy się w nowym oknie)

Autorzy: Vivek Iyer, Pinzhen Chen, and Alexandra Birch
Opublikowane w: 2023, ISBN 979-8-89176-041-7
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.WMT-1.44

FinGPT: Large Generative Models for a Small Language (odnośnik otworzy się w nowym oknie)

Autorzy: Luukkonen, Risto; Komulainen, Ville; Luoma, Jouni; Eskelinen, Anni; Kanerva, Jenna; Kupari, Hanna-Mari; Ginter, Filip; Laippala, Veronika; Muennighoff, Niklas; Piktus, Aleksandra; Wang, Thomas; Tazi, Nouamane; Scao, Teven Le; Wolf, Thomas; Suominen, Osma; Sairanen, Samuli; Merioksa, Mikko; Heinonen, Jyrki; Vahtola, Aija; Antao, Samuel; Pyysalo, Sampo
Opublikowane w: Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023, ISBN 979-8-89176-060-8
Wydawca: Association for Computational Linguistics
DOI: 10.48550/arxiv.2311.05640

Tokenization with Factorized Subword Encoding (odnośnik otworzy się w nowym oknie)

Autorzy: David Samuel and Lilja Øvrelid
Opublikowane w: 2023, ISBN 978-1-959429-62-3
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.FINDINGS-ACL.890

Towards Interpretable Mental Health Analysis with Large Language Models (odnośnik otworzy się w nowym oknie)

Autorzy: Yang, Kailai; Ji, Shaoxiong; Zhang, Tianlin; Xie, Qianqian; Kuang, Ziyan; Ananiadou, Sophia
Opublikowane w: Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023, ISBN 979-8-89176-060-8
Wydawca: Association for Computational Linguistics
DOI: 10.48550/arxiv.2304.03347

The OPUS-MT Dashboard – A Toolkit for a Systematic Evaluation of Open Machine Translation Models (odnośnik otworzy się w nowym oknie)

Autorzy: Jörg Tiedemann and Ona de Gibert
Opublikowane w: 2023, ISBN 978-1-959429-70-8
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.ACL-DEMO.30

Terminology-Aware Translation with Constrained Decoding and Large Language Model Prompting (odnośnik otworzy się w nowym oknie)

Autorzy: Bogoychev, Nikolay and Chen, Pinzhen
Opublikowane w: 2023, ISBN 979-8-89176-041-7
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.WMT-1.80

Monolingual or Multilingual Instruction Tuning: Which Makes a Better Alpaca (odnośnik otworzy się w nowym oknie)

Autorzy: Chen, Pinzhen; Ji, Shaoxiong; Bogoychev, Nikolay; Kutuzov, Andrey; Haddow, Barry; Heafield, Kenneth
Opublikowane w: EACL, 2023, ISBN 979-8-89176-088-2
Wydawca: Association for Computational Linguistics
DOI: 10.48550/arxiv.2309.08958

Unsupervised Feature Selection for Effective Parallel Corpus Filtering

Autorzy: Mikko Aulamo, Ona de Gibert, Sami Virpioja, and Jörg Tiedemann
Opublikowane w: Proceedings of the 24th Annual Conference of the European Association for Machine Translation, 2023, ISBN 978-952-03-2947-1
Wydawca: European Association for Machine Translation

Exploring Data Augmentation for Code Generation Tasks

Autorzy: Pinzhen Chen, Gerasimos Lampouras
Opublikowane w: 2023, ISBN 978-1-959429-47-0
Wydawca: Association for Computational Linguistics

Scaling Data-Constrained Language Models (odnośnik otworzy się w nowym oknie)

Autorzy: Muennighoff, Niklas; Rush, Alexander M.; Barak, Boaz; Scao, Teven Le; Piktus, Aleksandra; Tazi, Nouamane; Pyysalo, Sampo; Wolf, Thomas; Raffel, Colin
Opublikowane w: 2023, ISSN 2331-8422
Wydawca: NeurIPS'23
DOI: 10.48550/arxiv.2305.16264

CUNI Non-Autoregressive System for the WMT 22 Efficient Translation Shared Task (odnośnik otworzy się w nowym oknie)

Autorzy: Helcl, Jindřich
Opublikowane w: 2022, ISBN 978-1-959429-29-6
Wydawca: Association for Computational Linguistics
DOI: 10.48550/ARXIV.2212.00477

Cheating to Identify Hard Problems for Neural Machine Translation (odnośnik otworzy się w nowym oknie)

Autorzy: Proyag Pal, Kenneth Heafield
Opublikowane w: 2023, ISBN 978-1-959429-47-0
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2023.FINDINGS-EACL.120

Large Language Model Inference with Lexical Shortlisting (odnośnik otworzy się w nowym oknie)

Autorzy: Nikolay Bogoychev and Pinzhen Chen and Barry Haddow and Alexandra Birch
Opublikowane w: AAAI Workshop on Deployable AI, 2024, ISSN 2331-8422
Wydawca: arXiv
DOI: 10.48550/ARXIV.2311.09709

SpringerPlus (odnośnik otworzy się w nowym oknie)

Autorzy: Tiedemann J.; Aulamo M.; Bakshandaeva D.; Boggia M.; Grönroos S. A.; Nieminen T.; Raganato A.; Scherrer Y.; Vázquez R.; Virpioja S.
Opublikowane w: Springer, 2023, ISSN 2193-1801
Wydawca: Springer Science and Business Media Deutschland GmbH
DOI: 10.48550/ARXIV.2212.01936

HPLT High-Performance Language Technology: Building LLMs and TMs in European languages

Autorzy: Hajič, Jan
Opublikowane w: 2023
Wydawca: Oral presentation at Skeikampen, Norway

Iterative Translation Refinement with Large Language Models (odnośnik otworzy się w nowym oknie)

Autorzy: Chen, Pinzhen and Guo, Zhicheng and Haddow, Barry and Heafield, Kenneth
Opublikowane w: 2023, ISSN 2331-8422
Wydawca: arXiv
DOI: 10.48550/ARXIV.2306.03856

{EEE-QA}: Exploring effective and efficient question-answer representations (odnośnik otworzy się w nowym oknie)

Autorzy: Zhanghao Hu and Yijun Yang and Junjie Xu and Yifu Qiu and Pinzhen Chen
Opublikowane w: 2024, ISSN 2331-8422
Wydawca: arXiv
DOI: 10.48550/ARXIV.2403.02176

Velké jazykové modely: Co znamená velké a co jazykové?

Autorzy: Libovický, Jindřich
Opublikowane w: 2023
Wydawca: Talk at FI MUNI, Brno, Czechia

OpusCleaner and OpusTrainer, open source toolkits for training Machine Translation and Large language models (odnośnik otworzy się w nowym oknie)

Autorzy: Nikolay Bogoychev and Jelmer van der Linde and Graeme Nail and Barry Haddow and Jaume Zaragoza-Bernabeu and Gema Ramírez-Sánchez and Lukas Weymann and Tudor Nicolae Mateiu and Jindřich Helcl and Mikko Aulamo
Opublikowane w: 2023, ISSN 2331-8422
Wydawca: arXiv
DOI: 10.48550/ARXIV.2311.14838

Wyszukiwanie danych OpenAIRE...

Podczas wyszukiwania danych OpenAIRE wystąpił błąd

Brak wyników

Moja broszura 0 0