Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS

Multilingual and Cross-cultural interactions for context-aware, and bias-controlled dialogue systems for safety-critical applications

CORDIS fournit des liens vers les livrables publics et les publications des projets HORIZON.

Les liens vers les livrables et les publications des projets du 7e PC, ainsi que les liens vers certains types de résultats spécifiques tels que les jeux de données et les logiciels, sont récupérés dynamiquement sur OpenAIRE .

Publications

Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems (s’ouvre dans une nouvelle fenêtre)

Auteurs: Christos Vlachos, Themos Stafylakis, Ion Androutsopoulos
Publié dans: Findings of the Association for Computational Linguistics ACL 2024, 2024
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2024.FINDINGS-ACL.431

BESST Dataset: A Multimodal Resource for Speech-based Stress Detection and Analysis (s’ouvre dans une nouvelle fenêtre)

Auteurs: Jan Pešán, Vojtěch Juřík, Martin Karafiát, Jan Černocký
Publié dans: Interspeech 2024, 2024
Éditeur: ISCA
DOI: 10.21437/INTERSPEECH.2024-42

BUT systems and analyses for the ASVspoof 5 Challenge (s’ouvre dans une nouvelle fenêtre)

Auteurs: Johan Rohdin, Lin Zhang, Plchot Oldřich, Vojtěch Staněk, David Mihola, Junyi Peng, Themos Stafylakis, Dmitriy Beveraki, Anna Silnova, Jan Brukner, Lukáš Burget
Publié dans: The Automatic Speaker Verification Spoofing Countermeasures Workshop (ASVspoof 2024), 2024
Éditeur: ISCA
DOI: 10.21437/ASVSPOOF.2024-4

TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR (s’ouvre dans une nouvelle fenêtre)

Auteurs: Shashi Kumar, Srikanth Madikeri, Juan Pablo Zuluaga Gomez, Iuliia Thorbecke, Esaú Villatoro-tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S, Aravind Ganapathiraju
Publié dans: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.1167

Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units (s’ouvre dans une nouvelle fenêtre)

Auteurs: Bolaji Yusuf, Jan Honza Cernocky, Murat Saraçlar
Publié dans: Interspeech 2024, 2024
Éditeur: ISCA
DOI: 10.21437/INTERSPEECH.2024-1713

Parameter-Efficient Transfer Learning of Audio Spectrogram Transformers (s’ouvre dans une nouvelle fenêtre)

Auteurs: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti, Mirco Ravanelli
Publié dans: 2024 IEEE 34th International Workshop on Machine Learning for Signal Processing (MLSP), 2024
Éditeur: IEEE
DOI: 10.1109/MLSP58920.2024.10734776

Multitask Speech Recognition and Speaker Change Detection for Unknown Number of Speakers (s’ouvre dans une nouvelle fenêtre)

Auteurs: Shashi Kumar, Srikanth Madikeri, Iuliia Nigmatulina, Esaú Villatoro-Tello, Petr Motlicek, Karthik Pandia, S. Pavankumar Dubagunta, Aravind Ganapathiraju
Publié dans: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024
Éditeur: IEEE
DOI: 10.1109/ICASSP48485.2024.10446130

Large Language Models are Strong Audio-Visual Speech Recognition Learners (s’ouvre dans une nouvelle fenêtre)

Auteurs: Umberto Cappellazzo, Minsu Kim, Honglie Chen, Pingchuan Ma, Stavros Petridis, Daniele Falavigna, Alessio Brutti, Maja Pantic
Publié dans: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Éditeur: IEEE
DOI: 10.1109/ICASSP49660.2025.10889251

Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction (s’ouvre dans une nouvelle fenêtre)

Auteurs: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek
Publié dans: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.310

Multimodal Emotion Recognition Using Compressed Graph Neural Networks (s’ouvre dans une nouvelle fenêtre)

Auteurs: Tijana Đurkić, Nikola Simić, Siniša Suzić, Dragana Bajović, Zoran Perić, Vlado Delić
Publié dans: Lecture Notes in Computer Science, Speech and Computer, 2025
Éditeur: Springer Nature Switzerland
DOI: 10.1007/978-3-031-78014-1_9

BUT/JHU System Description for CHiME-8 NOTSOFAR-1 Challenge (s’ouvre dans une nouvelle fenêtre)

Auteurs: Alexander Polok, Dominik Klement, Jiangyu Han, Šimon Sedláček, Bolaji Yusuf, Matthew Maciejewski, Matthew S Wiesner, Lukáš Burget
Publié dans: 8th International Workshop on Speech Processing in Everyday Environments (CHiME 2024), 2024
Éditeur: ISCA
DOI: 10.21437/CHIME.2024-4

Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters (s’ouvre dans une nouvelle fenêtre)

Auteurs: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti
Publié dans: Interspeech 2024, 2024
Éditeur: ISCA
DOI: 10.21437/INTERSPEECH.2024-38

MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation (s’ouvre dans une nouvelle fenêtre)

Auteurs: Javier García Gilabert, Carlos Escolano, Audrey Mash, Xixian Liao, Maite Melero
Publié dans: Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (System Demonstrations), 2025
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2025.NAACL-DEMO.6

Recherche de données OpenAIRE...

Une erreur s’est produite lors de la recherche de données OpenAIRE

Aucun résultat disponible

Mon livret 0 0