CORDIS bietet Links zu öffentlichen Ergebnissen und Veröffentlichungen von HORIZONT-Projekten.
Links zu Ergebnissen und Veröffentlichungen von RP7-Projekten sowie Links zu einigen Typen spezifischer Ergebnisse wie Datensätzen und Software werden dynamisch von OpenAIRE abgerufen.
Leistungen
This deliverable consists of initial set of textual data acquired from web and non-web sources, both in monolingual and parallel parts, after cleaning done in WP2.
Free and open-source software will be released on GitHub.
First language models trained (öffnet in neuem Fenster)Language models will be made available for download however it may not have all or the cleanest data.
Translation models for select language pairs (öffnet in neuem Fenster)Models available for download trained using the pipeline.
Veröffentlichungen
Autoren:
de Gibert, Ona; Nail, Graeme; Arefyev, Nikolay; Bañón, Marta; van der Linde, Jelmer; Ji, Shaoxiong; Zaragoza-Bernabeu, Jaume; Aulamo, Mikko; Ramírez-Sánchez, Gema; Kutuzov, Andrey; Pyysalo, Sampo; Oepen, Stephan; Tiedemann, Jörg
Veröffentlicht in:
Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), 2024, ISSN 1530-9312
Herausgeber:
ELRA and ICCL
DOI:
10.48550/ARXIV.2403.14009
Autoren:
Tiedemann J.; Aulamo M.; Bakshandaeva D.; Boggia M.; Grönroos S. A.; Nieminen T.; Raganato A.; Scherrer Y.; Vázquez R.; Virpioja S.
Veröffentlicht in:
Springer, 2023, ISSN 2193-1801
Herausgeber:
Springer Science and Business Media Deutschland GmbH
DOI:
10.48550/ARXIV.2212.01936
Autoren:
Shaoxiong Ji; Zihao Li; Indraneil Paul; Jaakko Paavola; Peiqin Lin; Pinzhen Chen; Dayyán O'Brien; Hengyu Luo; Hinrich Schütze; Jörg Tiedemann; Barry Haddow
Veröffentlicht in:
CoRR, 2024, ISSN 2331-8422
Herausgeber:
ArXiv
DOI:
10.48550/ARXIV.2409.17892
Autoren:
Shaoxiong Ji; Timothee Mickus; Vincent Segonne; Jörg Tiedemann
Veröffentlicht in:
Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), 2024, ISSN 1530-9312
Herausgeber:
ELRA and ICCL
DOI:
10.48550/ARXIV.2403.16777
Autoren:
Laurie Burchell; Ona de Gibert; Nikolay Arefyev; Mikko Aulamo; Marta Bañón; Pinzhen Chen; Mariia Fedorova; Liane Guillou; Barry Haddow; Jan Hajic; Jindrich Helcl; Erik Henriksson; Mateusz Klimaszewski; Ville Komulainen; Andrey Kutuzov; Joona Kytöniemi; Veronika Laippala; Petter Mæhlum; Bhavitvya Malik; Farrokh Mehryary; Vladislav Mikhailov; Nikita Moghe; Amanda Myntti; Dayyán O'Brien; Stephan Oepen; Proyag Pal; Jousia Piha; Sampo Pyysalo; Gema Ramírez-Sánchez; David Samuel; Pavel Stepachev; Jörg Tiedemann; Dusan Varis; Tereza Vojtechová; Jaume Zaragoza-Bernabeu
Veröffentlicht in:
Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/ARXIV.2503.10267
Autoren:
Pinzhen Chen; Simon Yu; Zhicheng Guo; Barry Haddow
Veröffentlicht in:
Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/ARXIV.2406.12822
Autoren:
Luukkonen, Risto; Burdge, Jonathan; Zosa, Elaine; Talman, Aarne; Komulainen, Ville; Hatanpää, Väinö; Sarlin, Peter; Pyysalo, Sampo
Veröffentlicht in:
CoRR, 2024, ISSN 2331-8422
Herausgeber:
ArXiv
DOI:
10.48550/ARXIV.2404.01856
Autoren:
Ji, Shaoxiong; Chen, Pinzhen
Veröffentlicht in:
CoRR, 2024, ISSN 2331-8422
Herausgeber:
ArXiv
DOI:
10.48550/ARXIV.2404.04850
Autoren:
Lucas Georges Gabriel Charpentier, David Samuel
Veröffentlicht in:
The 2nd BabyLM Challenge at the 28th Conference on Computational Natural Language Learning, 2024, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
Autoren:
Ona De Gibert, Raúl Vázquez, Mikko Aulamo, Yves Scherrer, Sami Virpioja, Jörg Tiedemann
Veröffentlicht in:
2023, ISBN 978-1-959429-91-3
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.AMERICASNLP-1.20
Autoren:
Popel, Martin; Libovický, Jindřich; Helcl, Jindřich
Veröffentlicht in:
2022, ISBN 978-1-959429-29-6
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/ARXIV.2212.00486
Autoren:
Ashok Urlana, Pinzhen Chen, Zheng Zhao, Shay Cohen, Manish Shrivastava, Barry Haddow
Veröffentlicht in:
2023, ISBN 979-8-89176-061-5
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.FINDINGS-EMNLP.777
Autoren:
Vivek Iyer, Pinzhen Chen, and Alexandra Birch
Veröffentlicht in:
2023, ISBN 979-8-89176-041-7
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.WMT-1.44
Autoren:
Dayyán O’Brien, Bhavitvya Malik, Ona de Gibert, Pinzhen Chen, Barry Haddow, Jörg Tiedemann
Veröffentlicht in:
Proceedings of the Tenth Conference on Machine Translation, 2025
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2025.WMT-1.17
Autoren:
Tom Kocmi, Eleftherios Avramidis, Rachel Bawden, Ondřej Bojar, Anton Dvorkovich, Christian Federmann, Mark Fishel, Markus Freitag, Thamme Gowda, Roman Grundkiewicz, Barry Haddow, Philipp Koehn, Benjamin Marie, Christof Monz, Makoto Morishita, Kenton Murray, Makoto Nagata, Toshiaki Nakazawa, Martin Popel, Maja Popović, Mariya Shmatova
Veröffentlicht in:
Proceedings of the Eighth Conference on Machine Translation, 2023, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.WMT-1.1
Autoren:
Luukkonen, Risto; Komulainen, Ville; Luoma, Jouni; Eskelinen, Anni; Kanerva, Jenna; Kupari, Hanna-Mari; Ginter, Filip; Laippala, Veronika; Muennighoff, Niklas; Piktus, Aleksandra; Wang, Thomas; Tazi, Nouamane; Scao, Teven Le; Wolf, Thomas; Suominen, Osma; Sairanen, Samuli; Merioksa, Mikko; Heinonen, Jyrki; Vahtola, Aija; Antao, Samuel; Pyysalo, Sampo
Veröffentlicht in:
Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023, ISBN 979-8-89176-060-8
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/arxiv.2311.05640
Autoren:
Étienne Simon, Helene Bøsei Olsen, Ramón Carreño, Rahul Mishra, Nikolay Arefyev, Mert Can Yilmaz, Lilja Øvrelid, Erik Velldal
Veröffentlicht in:
Proceedings of the 21st Conference on Natural Language Processing (KONVENS 2025): Workshops, 2025
Herausgeber:
HsH Applied Academics
Autoren:
Ona de Gibert, Joseph Attieh, Teemu Vahtola, Mikko Aulamo, Zihao Li, Raúl Vázquez, Tiancheng Hu, Jörg Tiedemann
Veröffentlicht in:
Proceedings of the 2025 Conference on Empirical Methods in Natural Language Processing, 2025, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2025.EMNLP-MAIN.1408
Autoren:
David Samuel
Veröffentlicht in:
Proceedings of the BabyLM Challenge at the 27th Conference on Computational Natural Language Learning, 2023, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.CONLL-BABYLM.19
Autoren:
David Samuel, Andrey Kutuzov, Samia Touileb, Erik Velldal, Lilja Øvrelid, Egil Rønningstad, Elina Sigdel, Anna Palatkina
Veröffentlicht in:
Proceedings of the 24th Nordic Conference on Computational Linguistics (NoDaLiDa), 2023
Herausgeber:
University of Tartu Library
Autoren:
Elaine Zosa, Ville Komulainen, Sampo Pyysalo
Veröffentlicht in:
: Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), 2025
Herausgeber:
University of Tartu Library
Autoren:
Tom Kocmi, Ekaterina Artemova, Eleftherios Avramidis, Rachel Bawden, Ondřej Bojar, Konstantin Dranch, Anton Dvorkovich, Sergey Dukanov, Mark Fishel, Markus Freitag, Thamme Gowda, Roman Grundkiewicz, Barry Haddow, Marzena Karpinska, Philipp Koehn, Howard Lakougna, Jessica Lundin, Christof Monz, Kenton Murray, Masaaki Nagata, Stefano Perrella, Lorenzo Proietti, Martin Popel, Maja Popović, Parker Riley, Mariya Shmatova, Steinthór Steingrímsson, Lisa Yankovskaya, Vilém Zouhar
Veröffentlicht in:
Proceedings of the Tenth Conference on Machine Translation, 2025, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2025.WMT-1.22
Autoren:
David Samuel and Lilja Øvrelid
Veröffentlicht in:
2023, ISBN 978-1-959429-62-3
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.FINDINGS-ACL.890
Autoren:
Erik Henriksson, Otto Tarkka, Filip Ginter
Veröffentlicht in:
Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), 2025
Herausgeber:
University of Tartu Library
Autoren:
Pinzhen Chen, Zheng Zhao, Shun Shao
Veröffentlicht in:
Proceedings of The Second Arabic Natural Language Processing Conference, 2024, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2024.ARABICNLP-1.75
Autoren:
Yang, Kailai; Ji, Shaoxiong; Zhang, Tianlin; Xie, Qianqian; Kuang, Ziyan; Ananiadou, Sophia
Veröffentlicht in:
Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023, ISBN 979-8-89176-060-8
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/arxiv.2304.03347
Autoren:
Ona De Gibert, Robert Pugh, Ali Marashian, Raul Vazquez, Abteen Ebrahimi, Pavel Denisov, Enora Rice, Edward Gow-Smith, Juan Prieto, Melissa Robles, Rubén Manrique, Oscar Moreno, Angel Lino, Rolando Coto-Solano, Aldo Alvarez, Marvin Agüero-Torales, John E. Ortega, Luis Chiruzzo, Arturo Oncevay, Shruti Rijhwani, Katharina Von Der Wense, Manuel Mager
Veröffentlicht in:
Proceedings of the Fifth Workshop on NLP for Indigenous Languages of the Americas (AmericasNLP), 2025, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2025.AMERICASNLP-1.16
Autoren:
Jörg Tiedemann and Ona de Gibert
Veröffentlicht in:
2023, ISBN 978-1-959429-70-8
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.ACL-DEMO.30
Autoren:
Bogoychev, Nikolay and Chen, Pinzhen
Veröffentlicht in:
2023, ISBN 979-8-89176-041-7
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.WMT-1.80
Autoren:
Chen, Pinzhen; Ji, Shaoxiong; Bogoychev, Nikolay; Kutuzov, Andrey; Haddow, Barry; Heafield, Kenneth
Veröffentlicht in:
EACL, 2023, ISBN 979-8-89176-088-2
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/arxiv.2309.08958
Autoren:
Hanxu Hu, Simon Yu, Pinzhen Chen, Edoardo Ponti
Veröffentlicht in:
Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (Volume 1: Long Papers), 2025, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2025.NAACL-LONG.288
Autoren:
Stephan Oepen and Nikolay Arefev and Mikko Aulamo and Marta Bañón and Maja Buljan and Laurie Burchell and Lucas Charpentier and Pinzhen Chen and Mariya Fedorova and Ona de Gibert and Barry Haddow and Jan Hajič and Jindřich Helcl and Andrey Kutuzov and Ver
Veröffentlicht in:
Proceedings of the Fifteenth Language Resources and Evaluation Conference, 2026, ISSN 2522-2686
Herausgeber:
International Conference on Language Resources and Evaluation
Autoren:
Laurie Burchell, Alexandra Birch, Nikolay Bogoychev, Kenneth Heafield
Veröffentlicht in:
Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers), 2023, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.ACL-SHORT.75
Autoren:
Mikko Aulamo, Ona de Gibert, Sami Virpioja, and Jörg Tiedemann
Veröffentlicht in:
Proceedings of the 24th Annual Conference of the European Association for Machine Translation, 2023, ISBN 978-952-03-2947-1
Herausgeber:
European Association for Machine Translation
Autoren:
Pinzhen Chen, Gerasimos Lampouras
Veröffentlicht in:
2023, ISBN 978-1-959429-47-0
Herausgeber:
Association for Computational Linguistics
Autoren:
Muennighoff, Niklas; Rush, Alexander M.; Barak, Boaz; Scao, Teven Le; Piktus, Aleksandra; Tazi, Nouamane; Pyysalo, Sampo; Wolf, Thomas; Raffel, Colin
Veröffentlicht in:
2023, ISSN 2331-8422
Herausgeber:
NeurIPS'23
DOI:
10.48550/arxiv.2305.16264
Autoren:
Helcl, Jindřich
Veröffentlicht in:
2022, ISBN 978-1-959429-29-6
Herausgeber:
Association for Computational Linguistics
DOI:
10.48550/ARXIV.2212.00477
Autoren:
Burchell, Laurie and Birch, Alexandra and Thompson, Robert and Heafield, Kenneth
Veröffentlicht in:
Proceedings of the 18th Conference of the European Chapter of the Association for Computational Linguistics (Volume 1: Long Papers), 2024, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
Autoren:
Jindřich Helcl
Veröffentlicht in:
Proceedings of the Seventh Conference on Machine Translation (WMT), 2022, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
Autoren:
Ramírez-Sánchez, Gema; Chen, Pinzhen; Helcl, Jindřich; Zaragoza-Bernabeu, Jaume; Malik, Bhavitvya; De Gibert Bonet, Ona; Stepachev, Pavel; Variš, Dušan; Haddow, Barry; Arefyev, Nikolay; Tiedemann, Jörg
Veröffentlicht in:
2024, ISSN 1530-9312
Herausgeber:
European Association for Machine Translation (EAMT)
Autoren:
Ona de Gibert, Tommi Nieminen, Yves Scherrer, Jörg Tiedemann
Veröffentlicht in:
Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), 2025
Herausgeber:
University of Tartu Library
Autoren:
Nikolay Arefyev, Mikko Aulamo, Marta Bañón, Laurie Burchell, Pinzhen Chen, Mariia Fedorova, Ona de Gibert, Liane Guillou, Barry Haddow, Jan Hajič, Jindřich Helcl, Erik Henriksson, Andrey Kutuzov, Veronika Laippala, Bhavitvya Malik, Farrokh Mehryary, Vladi
Veröffentlicht in:
Proceedings of Machine Translation Summit XX: Volume 2, 2025
Herausgeber:
European Association for Machine Translation
Autoren:
Ona de Gibert, Dayyán O’Brien, Dušan Variš, Jörg Tiedemann
Veröffentlicht in:
Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), 2025
Herausgeber:
University of Tartu Library
Autoren:
Proyag Pal, Kenneth Heafield
Veröffentlicht in:
2023, ISBN 978-1-959429-47-0
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.FINDINGS-EACL.120
Autoren:
Nikolay Bogoychev, Pinzhen Chen, Barry Haddow, Alexandra Birch
Veröffentlicht in:
Proceedings of the Fifth Workshop on Insights from Negative Results in NLP, 2024, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2024.INSIGHTS-1.17
Autoren:
Nikolay Bogoychev and Pinzhen Chen and Barry Haddow and Alexandra Birch
Veröffentlicht in:
AAAI Workshop on Deployable AI, 2024, ISSN 2331-8422
Herausgeber:
arXiv
DOI:
10.48550/ARXIV.2311.09709
Autoren:
Lucas Georges Gabriel Charpentier, David Samuel
Veröffentlicht in:
Proceedings of the BabyLM Challenge at the 27th Conference on Computational Natural Language Learning, 2023, ISSN 1530-9312
Herausgeber:
Association for Computational Linguistics
DOI:
10.18653/V1/2023.CONLL-BABYLM.20
Autoren:
Hajič, Jan
Veröffentlicht in:
2023
Herausgeber:
Oral presentation at Skeikampen, Norway
Autoren:
Chen, Pinzhen and Guo, Zhicheng and Haddow, Barry and Heafield, Kenneth
Veröffentlicht in:
2023, ISSN 2331-8422
Herausgeber:
arXiv
DOI:
10.48550/ARXIV.2306.03856
Autoren:
Zhanghao Hu and Yijun Yang and Junjie Xu and Yifu Qiu and Pinzhen Chen
Veröffentlicht in:
2024, ISSN 2331-8422
Herausgeber:
arXiv
DOI:
10.48550/ARXIV.2403.02176
Autoren:
Libovický, Jindřich
Veröffentlicht in:
2023
Herausgeber:
Talk at FI MUNI, Brno, Czechia
Autoren:
Nikolay Bogoychev and Jelmer van der Linde and Graeme Nail and Barry Haddow and Jaume Zaragoza-Bernabeu and Gema Ramírez-Sánchez and Lukas Weymann and Tudor Nicolae Mateiu and Jindřich Helcl and Mikko Aulamo
Veröffentlicht in:
2023, ISSN 2331-8422
Herausgeber:
arXiv
DOI:
10.48550/ARXIV.2311.14838
Suche nach OpenAIRE-Daten ...
Bei der Suche nach OpenAIRE-Daten ist ein Fehler aufgetreten
Es liegen keine Ergebnisse vor