Skip to main content
CORDIS - Forschungsergebnisse der EU
CORDIS

Found in Translation – Natural Language Understanding with Cross-Lingual Grounding

Veröffentlichungen

TaPaCo: A Corpus of Sentential Paraphrases for 73 Languages

Autoren: Yves Scherrer
Veröffentlicht in: Proceedings of The 12th Language Resources and Evaluation Conference, 2020, Seite(n) 6868-6873, ISBN 979-10-95546-34-4
Herausgeber: European Language Resources Association (ELRA)

HeLju@VarDial 2020: Social Media Variety Geolocation with BERT Models

Autoren: Yves Scherrer, Nikola Ljubešić
Veröffentlicht in: Proceedings of the 7th Workshop on NLP for Similar Languages, Varieties and Dialects, 2020, Seite(n) 202-211, ISBN 978-1-952148-47-7
Herausgeber: International Committee on Computational Linguistics (ICCL)

Paraphrase Generation and Evaluation on Colloquial-Style Sentences

Autoren: Eetu Ilari Sjöblom, Mathias Creutz, Yves Scherrer
Veröffentlicht in: Proceedings of the 12th Language Resources and Evaluation Conference, 2020, Seite(n) 1814-1822, ISBN 979-10-95546-34-4
Herausgeber: European Language Resources Association (ELRA)

How Does Data Corruption Affect Natural Language Understanding Models? A Study on GLUE datasets

Autoren: Aarne Talman, Marianna Apidianaki, Stergios Chatzikyriakidis, Jörg Tiedemann
Veröffentlicht in: 2022
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2022.starsem-1.20

OpusFilter: A Configurable Parallel Corpus Filtering Toolbox

Autoren: Mikko Aulamo, Sami Virpioja, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: System Demonstrations, 2020, Seite(n) 150-156
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2020.acl-demos.20

MULTISEM at SemEval-2020 Task 3: Fine-tuning BERT for Lexical Meaning

Autoren: Aina Garí Soler, Marianna Apidianaki
Veröffentlicht in: Proceedings of the Fourteenth Workshop on Semantic Evaluation, Ausgabe December 2020, 2020, Seite(n) 158–165
Herausgeber: International Committee for Computational Linguistics

Effects of Language Relatedness for Cross-lingual Transfer Learning in Character-Based Language Models

Autoren: Mittul Singh, Peter Smit, Sami Virpioja, Mikko Kurimo
Veröffentlicht in: Proceedings of the 1st Joint Workshop on Spoken Language Technologies for Under-resourced languages (SLTU) and Collaboration and Computing for Under-Resourced Languages (CCURL), 2020, Seite(n) 41-45, ISBN 979-10-95546-35-1
Herausgeber: European Language Resources Association (ELRA)

Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics : Human Language Technologies

Autoren: Aina Gari Soler, Marianna Apidianaki
Veröffentlicht in: 2021
Herausgeber: The Association for Computational Linguistics
DOI: 10.18653/v1/2021.naacl-main.370

Sesame Street to Mount Sinai: BERT-constrained character-level Moses models for multilingual lexical normalization

Autoren: Yves Scherrer, Nikola Ljubešić
Veröffentlicht in: 2021
Herausgeber: The Association for Computational Linguistics

Morfessor EM+Prune: Improved Subword Segmentation with Expectation Maximization and Pruning

Autoren: Stig-Arne Grönroos, Sami Virpioja, Mikko Kurimo
Veröffentlicht in: Proceedings of The 12th Language Resources and Evaluation Conference, 2020, Seite(n) 3944-3953, ISBN 979-10-95546-34-4
Herausgeber: European Language Resources Association (ELRA)

FinChat: Corpus and Evaluation Setup for Finnish Chat Conversations on Everyday Topics

Autoren: Katri Leino, Juho Leinonen, Mittul Singh, Sami Virpioja, Mikko Kurimo
Veröffentlicht in: Interspeech 2020, 2020, Seite(n) 429-433
Herausgeber: ISCA
DOI: 10.21437/interspeech.2020-2511

OPUS-MT -- Building open translation services for the World

Autoren: Jörg Tiedemann, Santhosh Thottingal
Veröffentlicht in: Proceedings of the 22nd Annual Conference of the European Association for Machine Translation, 2020, Seite(n) 479-480, ISBN 978-989-33-0589-8
Herausgeber: European Association for Machine Translation

Fixed Encoder Self-Attention Patterns in Transformer-Based Machine Translation

Autoren: Alessandro Raganato, Yves Scherrer, Jörg Tiedemann
Veröffentlicht in: Findings of the Association for Computational Linguistics : EMNLP 2020, 2020, Seite(n) 556-568, ISBN 978-1-952148-90-3
Herausgeber: The Association for Computational Linguistics

The University of Helsinki and Aalto University submissions to the WMT 2020 news and low-resource translation tasks

Autoren: Yves Scherrer, Stig-Arne Grönroos, Sami Virpioja
Veröffentlicht in: Proceedings of the Fifth Conference on Machine Translation, 2020, Seite(n) 1129-1138, ISBN 978-1-948087-81-0
Herausgeber: The Association for Computational Linguistics

Controlling the Imprint of Passivization and Negation in Contextualized Representations

Autoren: Hande Celikkanat, Sami Virpioja, Jörg Tiedemann, Marianna Apidianaki
Veröffentlicht in: Proceedings of the Third BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP, 2020, Seite(n) 136-148, ISBN 978-1-952148-86-6
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2020.blackboxnlp-1.13

NLI Data Sanity Check: Assessing the Effect of Data Corruption on Model Performance

Autoren: Aarne Talman, Marianna Apidianaki, Stergios Chatzikyriakidis, Jörg Tiedemann
Veröffentlicht in: 2021
Herausgeber: Linköping University Electronic Press, Sweden

A Closer Look at Parameter Contributions When Training Neural Language and Translation Models

Autoren: Raúl Vázquez, Hande Celikkanat, Vinit Ravishankar, Mathias Creutz, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 29th International Conference on Computational Linguistics, 2022, Seite(n) 4788–4800
Herausgeber: International Committee on Computational Linguistics

BERT Knows Punta Cana is not just beautiful, it’s gorgeous: Ranking Scalar Adjectives with Contextualised Representations

Autoren: Aina Garí Soler, Marianna Apidianaki
Veröffentlicht in: Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2020, Seite(n) 7371-7385
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2020.emnlp-main.598

The MUCOW word sense disambiguation test suite at WMT 2020

Autoren: Yves Scherrer, Alessandro Raganato, Jörg Tiedemann
Veröffentlicht in: Proceedings of the Fifth Conference on Machine Translation, 2020, Seite(n) 365-370, ISBN 978-1-948087-81-0
Herausgeber: The Association for Computational Linguistics

Latest Development in the FoTran Project – Scaling Up Language Coverage in Neural Machine Translation Using Distributed Training with Language-Specific Components

Autoren: Raúl Vázquez, Michele Boggia, Alessandro Raganato, Niki A. Loppi, Stig-Arne Grönroos, Jörg Tiedemann
Veröffentlicht in: 2022
Herausgeber: European Association for Machine Translation

Wikipedia Entities as Rendezvous across Languages: Grounding Multilingual Language Models by Predicting Wikipedia Hyperlinks

Autoren: Iacer Calixto, Alessandro Raganato, Tommaso Pasini
Veröffentlicht in: Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2021, Seite(n) 3651-3661
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2021.naacl-main.286

The University of Helsinki Submission to the IWSLT2020 Offline SpeechTranslation Task

Autoren: Raúl Vázquez, Mikko Aulamo, Umut Sulubacak, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 17th International Conference on Spoken Language Translation, 2020, Seite(n) 95-102, ISBN 978-1-952148-07-1
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2020.iwslt-1.10

Emerging Language Spaces Learned From Massively Multilingual Corpora. In Proceedings of the 3rd Conference on Digital Humanities in the Nordic Countries (DHN 2018), Helsinki, Finland

Autoren: Tiedemann, Jörg
Veröffentlicht in: Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference (DHN 2018), 2018, Seite(n) 188-197
Herausgeber: CEUR Workshop Proceedings

An Evaluation of Language-Agnostic Inner-Attention-Based Representations in Machine Translation

Autoren: Alessandro Raganato, Raúl Vázquez, Mathias Creutz, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 4th Workshop on Representation Learning for NLP (RepL4NLP-2019), 2019, Seite(n) 27-32, ISBN 978-1-950737-35-2
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-4304

The University of Helsinki Submissions to the WMT19 Similar Language Translation Task

Autoren: Yves Scherrer, Raúl Vázquez, Sami Virpioja
Veröffentlicht in: Proceedings of the Fourth Conference on Machine Translation (Volume 3: Shared Task Papers, Day 2), 2019, Seite(n) 236-244, ISBN 978-1-950737-27-7
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-5432

The University of Helsinki Submissions to the WMT19 News Translation Task

Autoren: Aarne Talman, Umut Sulubacak, Raúl Vázquez, Yves Scherrer, Sami Virpioja, Alessandro Raganato, Arvi Hurskainen, Jörg Tiedemann
Veröffentlicht in: Proceedings of the Fourth Conference on Machine Translation (Volume 2: Shared Task Papers, Day 1), 2019, Seite(n) 412-423, ISBN 978-1-950737-27-7
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-5347

The University of Helsinki Submission to the WMT19 Parallel Corpus Filtering Task

Autoren: Raúl Vázquez, Umut Sulubacak, Jörg Tiedemann
Veröffentlicht in: Proceedings of the Fourth Conference on Machine Translation (Volume 3: Shared Task Papers, Day 2), 2019, Seite(n) 294-300, ISBN 978-1-950737-27-7
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-5441

Multilingual NMT with a Language-Independent Attention Bridge

Autoren: Raúl Vázquez, Alessandro Raganato, Jörg Tiedemann, Mathias Creutz
Veröffentlicht in: Proceedings of the 4th Workshop on Representation Learning for NLP (RepL4NLP-2019), 2019, Seite(n) 33-39, ISBN 978-1-950737-35-2
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-4305

SUM-QE: a BERT-based Summary Quality Estimation Model

Autoren: Stratos Xenouleas, Prodromos Malakasiotis, Marianna Apidianaki, Ion Androutsopoulos
Veröffentlicht in: Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), 2019, Seite(n) 6004-6010
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/d19-1618

An Analysis of Encoder Representations in Transformer-Based Machine Translation

Autoren: Alessandro Raganato, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 2018 EMNLP Workshop BlackboxNLP: Analyzing and Interpreting Neural Networks for NLP, 2018, Seite(n) 287-297, ISBN 978-1-948087-71-1
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w18-5431

The University of Helsinki submissions to the WMT18 news task

Autoren: Alessandro Raganato, Yves Scherrer, Tommi Nieminen, Arvi Hurskainen, Jörg Tiedemann
Veröffentlicht in: Proceedings of the Third Conference on Machine Translation: Shared Task Papers, 2018, Seite(n) 488-495, ISBN 978-1-948087-81-0
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w18-6425

The MuCoW test suite at WMT 2019: Automatically harvested multilingual contrastive word sense disambiguation test sets for machine translation.

Autoren: Alessandro Raganato, Yves Scherrer, Jörg Tiedemann
Veröffentlicht in: In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL): Student Research Workshop. 2019., 2019, Seite(n) 470-480, ISBN 9781-950737277
Herausgeber: The Association for Computational Linguistics

Analysing concatenation approaches to document-level NMT in two different domains

Autoren: Yves Scherrer, Jörg Tiedemann, Sharid Loáiciga
Veröffentlicht in: Proceedings of the Fourth Workshop on Discourse in Machine Translation (DiscoMT 2019), 2019, Seite(n) 51-61, ISBN 978-1-950737-74-1
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/d19-6506

Measuring Semantic Abstraction of Multilingual

Autoren: Jörg Tiedemann, Yves Scherrer
Veröffentlicht in: Proceedings of the 3rd Workshop on Evaluating Vector Space Representations for, 2019, Seite(n) 35-42, ISBN 978-1-950737-05-5
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-2005

The WMT’18 Morpheval test suites for English-Czech, English-German, English-Finnish and Turkish-English

Autoren: Franck Burlot, Yves Scherrer, Vinit Ravishankar, Ondřej Bojar, Stig-Arne Grönroos, Maarit Koponen, Tommi Nieminen, François Yvon
Veröffentlicht in: Proceedings of the Third Conference on Machine Translation: Shared Task Papers, 2018, Seite(n) 546-560, ISBN 978-1-948087-81-0
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w18-6433

Predicting Prosodic Prominence from Text with Pre-trained Contextualized Word Representations

Autoren: Aarne Talman, Antti Suni, Hande Celikkanat, Sofoklis Kakouros, Jörg Tiedemann, Martti Vainio
Veröffentlicht in: 22nd Nordic Conference on Computational Linguistics (NoDaLiDa) : Proceedings of the Conference, 2019, Seite(n) 281–290, ISBN 978-91-7929-995-8
Herausgeber: Linköping University Electronic Press

The University of Helsinki submissions to the IWSLT 2018 low-resource translation task

Autoren: Yves Scherrer
Veröffentlicht in: Proceedings of the 15th International Workshop on Spoken Language Translation, 2018, Seite(n) 83-88
Herausgeber: International Workshop on Spoken Language Translation - Brugge, Belgium

Ensembles of Neural Morphological Inflection Models

Autoren: Ilmari Kylliäinen, Miikka Silfverberg
Veröffentlicht in: Proceedings of the 22nd Nordic Conference on Computational Linguistics, 2019, Seite(n) 304–309
Herausgeber: Linköping University Electronic Press

Data-Driven Morphological Analysis for Uralic Languages

Autoren: Miikka Silfverberg, Francis Tyers
Veröffentlicht in: Proceedings of the Fifth International Workshop on Computational Linguistics for Uralic Languages, 2019, Seite(n) 1-14
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-0301

Weird Inflects but OK: Making Sense of Morphological Generation Errors

Autoren: Kyle Gorman, Arya D. McCarthy, Ryan Cotterell, Ekaterina Vylomova, Miikka Silfverberg, Magdalena Markowska
Veröffentlicht in: Proceedings of the 23rd Conference on Computational Natural Language Learning (CoNLL), 2019, Seite(n) 140-151
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/k19-1014

The SIGMORPHON 2019 Shared Task: Morphological Analysis in Context and Cross-Lingual Transfer for Inflection

Autoren: Arya D. McCarthy, Ekaterina Vylomova, Shijie Wu, Chaitanya Malaviya, Lawrence Wolf-Sonkin, Garrett Nicolai, Christo Kirov, Miikka Silfverberg, Sebastian J. Mielke, Jeffrey Heinz, Ryan Cotterell, Mans Hulden
Veröffentlicht in: Proceedings of the 16th Workshop on Computational Research in Phonetics, Phonology, and Morphology, 2019, Seite(n) 229-244
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/w19-4226

The Helsinki submission to the AmericasNLP shared task

Autoren: Raúl Vázquez, Yves Scherrer, Sami Virpioja, Jörg Tiedemann
Veröffentlicht in: Proceedings of the First Workshop on Natural Language Processing for Indigenous Languages of the Americas, 2021, Seite(n) 255-264
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2021.americasnlp-1.29

Recent Trends in Word Sense Disambiguation: A Survey

Autoren: Michele Bevilacqua, Tommaso Pasini, Alessandro Raganato, Roberto Navigli
Veröffentlicht in: Proceedings of the Thirtieth International Joint Conference on Artificial Intelligence, 2021, Seite(n) 4330-4338, ISBN 978-0-9992411-9-6
Herausgeber: International Joint Conferences on Artificial Intelligence Organization
DOI: 10.24963/ijcai.2021/593

On the differences between BERT and MT encoder spaces and how to address them in translation tasks

Autoren: Raúl Vázquez, Hande Celikkanat, Mathias Creutz, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: Student Research Workshop, 2021, Seite(n) 337-347
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2021.acl-srw.35

An Empirical Investigation of Word Alignment Supervision for Zero-Shot Multilingual Neural Machine Translation

Autoren: Alessandro Raganato, Raúl Vázquez, Mathias Creutz, Jörg Tiedemann
Veröffentlicht in: 2021
Herausgeber: The Association for Computational Linguistics

Morfessor-enriched features and multilingual training for canonical morphological segmentation

Autoren: Aku Rouhe, Stig-Arne Grönroos, Sami Virpioja, Mathias Creutz, Mikko Kurimo
Veröffentlicht in: 2022
Herausgeber: The Association for Computational Linguistics
DOI: 10.18653/v1/2022.sigmorphon-1.16

XL-WiC: A Multilingual Benchmark for Evaluating Semantic Contextualization

Autoren: Alessandro Raganato, Tommaso Pasini, Jose Camacho-Collados, Mohammad Taher Pilehvar
Veröffentlicht in: Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2020, Seite(n) 7193-7206
Herausgeber: Association for Computational Linguistics
DOI: 10.18653/v1/2020.emnlp-main.584

OpusTools and Parallel Corpus Diagnostics

Autoren: Mikko Aulamo, Umut Sulubacak, Sami Virpioja, Jörg Tiedemann
Veröffentlicht in: Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), 2020, Seite(n) 3782-3789, ISBN 979-10-95546-34-4
Herausgeber: European Language Resources Association (ELRA)

The Tatoeba Translation Challenge - Realistic Data Sets for Low Resource and Multilingual MT

Autoren: Jörg Tiedemann
Veröffentlicht in: Proceedings of the Fifth Conference on Machine Translation, 2020, Seite(n) 1174-1182, ISBN 978-1-948087-81-0
Herausgeber: The Association for Computational Linguistics

Semiautomatic Speech Alignment for Under-Resourced Languages

Autoren: Juho Leinonen, Niko Partanen, Sami Virpioja, Mikko Kurimo
Veröffentlicht in: 2022
Herausgeber: European Language Resources Association (ELRA)

An Evaluation Benchmark for Testing the Word Sense Disambiguation Capabilities of Machine Translation Systems

Autoren: Alessandro Raganato, Yves Scherrer, Jörg Tiedemann
Veröffentlicht in: Proceedings of The 12th Language Resources and Evaluation Conference, 2020, Seite(n) 3668-3675, ISBN 979-10-95546-34-4
Herausgeber: European Language Resources Association (ELRA)

HELFI: a Hebrew-Greek-Finnish Parallel Bible Corpus with Cross-Lingual Morpheme Alignment

Autoren: Yli-Jyrä, Anssi; Purhonen, Josi; Liljeqvist, Matti; Antturi, Arto; Nieminen, Pekka; Räntilä, Kari M.; Luoto, Valtter
Veröffentlicht in: Proceedings of LREC, Ausgabe 5, 2020
Herausgeber: ELRA
DOI: 10.48550/arxiv.2003.07456

From open parallel corpora to public translation tools : The success story of OPUS

Autoren: Tiedemann, Jörg
Veröffentlicht in: 2022
Herausgeber: University of Göteborg

Democratizing neural machine translation with OPUS-MT

Autoren: Tiedemann J.; Aulamo M.; Bakshandaeva D.; Boggia M.; Grönroos S. A.; Nieminen T.; Raganato A.; Scherrer Y.; Vázquez R.; Virpioja S.
Veröffentlicht in: Language Resources and Evaluation, Ausgabe 50, 2023, ISSN 1574-020X
Herausgeber: Springer Verlag
DOI: 10.1007/s10579-023-09704-w

A Systematic Study of Inner-Attention-Based Sentence Representations in Multilingual Neural Machine Translation

Autoren: Raúl Vázquez, Alessandro Raganato, Mathias Creutz, Jörg Tiedemann
Veröffentlicht in: Computational Linguistics, Ausgabe 46/2, 2020, Seite(n) 387-424, ISSN 0891-2017
Herausgeber: MIT Press
DOI: 10.1162/coli_a_00377

Are Multilingual Neural Machine Translation Models Better at Capturing Linguistic Features?

Autoren: David Mareček, Hande Celikkanat, Miikka Silfverberg, Vinit Ravishankar, Jörg Tiedemann
Veröffentlicht in: Prague Bulletin of Mathematical Linguistics, Ausgabe 115/1, 2020, Seite(n) 143-162, ISSN 1804-0462
Herausgeber: Institute of Formal and Applied Linguistics, Charles University
DOI: 10.14712/00326585.009

Transfer learning and subword sampling for asymmetric-resource one-to-many neural translation

Autoren: Stig-Arne Gronroos, Sami Virpioja, Mikko Kurimo
Veröffentlicht in: Machine Translation, Ausgabe 34, 2021, Seite(n) 251-286, ISSN 0922-6567
Herausgeber: Kluwer Academic Publishers
DOI: 10.1007/s10590-020-09253-x

What Do Language Representations Really Represent?

Autoren: Johannes Bjerva, Robert Östling, Maria Han Veiga, Jörg Tiedemann, Isabelle Augenstein
Veröffentlicht in: Computational Linguistics, Ausgabe 45/2, 2019, Seite(n) 381-389, ISSN 0891-2017
Herausgeber: MIT Press
DOI: 10.1162/coli_a_00351

Neural morphosyntactic tagging for Rusyn

Autoren: Yves Scherrer, Achim Rabus
Veröffentlicht in: Natural Language Engineering, Ausgabe 25/5, 2019, Seite(n) 633-650, ISSN 1351-3249
Herausgeber: Cambridge University Press
DOI: 10.1017/s1351324919000287

Digitising Swiss German: how to process and study a polycentric spoken language

Autoren: Yves Scherrer, Tanja Samardžić, Elvira Glaser
Veröffentlicht in: Language Resources and Evaluation, Ausgabe 53/4, 2019, Seite(n) 735-769, ISSN 1574-020X
Herausgeber: Springer Verlag
DOI: 10.1007/s10579-019-09457-5

Sentence Embeddings in NLI with Iterative Refinement Encoders

Autoren: Aarne Johannes Talman, Anssi Yli-Jyrä, Jörg Tiedemann
Veröffentlicht in: Natural Language Engineering, 2019, Seite(n) 467-482, ISSN 1351-3249
Herausgeber: Cambridge University Press

A Finnish news corpus for named entity recognition

Autoren: Teemu Ruokolainen, Pekka Kauppinen, Miikka Silfverberg, Krister Lindén
Veröffentlicht in: Language Resources and Evaluation, Ausgabe 54/1, 2020, Seite(n) 247-272, ISSN 1574-020X
Herausgeber: Springer Verlag
DOI: 10.1007/s10579-019-09471-7

How to Dissect a Muppet: The Structure of Transformer Embedding Spaces

Autoren: Timothee Mickus, Denis Paperno, Mathieu Constant
Veröffentlicht in: How to Dissect a Muppet: The Structure of Transformer Embedding Spaces, 2022, ISSN 2307-387X
Herausgeber: Transactions of the Association for Computational Linguistics (TACL)
DOI: 10.1162/tacl_a_00501

Advances in subword-based HMM-DNN speech recognition across languages

Autoren: Peter Smit, Sami Virpioja, Mikko Kurimo
Veröffentlicht in: Computer Speech & Language, Ausgabe 66, 2021, Seite(n) 101158, ISSN 0885-2308
Herausgeber: Academic Press
DOI: 10.1016/j.csl.2020.101158

Idiosyncratic frequency as a measure of derivation vs. inflection

Autoren: Maria Copot, Timothee Mickus, Olivier Bonami
Veröffentlicht in: Journal of Language Modeling, 2023, ISSN 2299-8470
Herausgeber: Online
DOI: 10.15398/jlm.v10i2.301

Let's Play Mono-Poly: BERT Can Reveal Words' Polysemy Level and Partitionability into Senses

Autoren: Aina Gari Soler, Marianna Apidianaki
Veröffentlicht in: Transactions of the Association for Computational Linguistics (TACL), 2021, Seite(n) 825-844, ISSN 2307-387X
Herausgeber: Transactions of the Association for Computational Linguistics (TACL)

European Language Grid : A Language Technology Platform for Multilingual Europe: Open Translation Models, Tools and Services

Autoren: Jörg Tiedemann, Mikko Aulamo, Sam Hardwick, Tommi Nieminen
Veröffentlicht in: Cognitive Technologies, 2022
Herausgeber: Springer

Språk(teknologi) är nyckeln till intelligens och rättvisa

Autoren: Jörg Tiedemann
Veröffentlicht in: 2022, ISSN 0358-9293
Herausgeber: Språkbruk

Suche nach OpenAIRE-Daten ...

Bei der Suche nach OpenAIRE-Daten ist ein Fehler aufgetreten

Es liegen keine Ergebnisse vor