Skip to main content
Ir a la página de inicio de la Comisión Europea (se abrirá en una nueva ventana)
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Multilingual and Cross-cultural interactions for context-aware, and bias-controlled dialogue systems for safety-critical applications

CORDIS proporciona enlaces a los documentos públicos y las publicaciones de los proyectos de los programas marco HORIZONTE.

Los enlaces a los documentos y las publicaciones de los proyectos del Séptimo Programa Marco, así como los enlaces a algunos tipos de resultados específicos, como conjuntos de datos y «software», se obtienen dinámicamente de OpenAIRE .

Publicaciones

Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems (se abrirá en una nueva ventana)

Autores: Christos Vlachos, Themos Stafylakis, Ion Androutsopoulos
Publicado en: Findings of the Association for Computational Linguistics ACL 2024, 2024
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2024.FINDINGS-ACL.431

BESST Dataset: A Multimodal Resource for Speech-based Stress Detection and Analysis (se abrirá en una nueva ventana)

Autores: Jan Pešán, Vojtěch Juřík, Martin Karafiát, Jan Černocký
Publicado en: Interspeech 2024, 2024
Editor: ISCA
DOI: 10.21437/INTERSPEECH.2024-42

BUT systems and analyses for the ASVspoof 5 Challenge (se abrirá en una nueva ventana)

Autores: Johan Rohdin, Lin Zhang, Plchot Oldřich, Vojtěch Staněk, David Mihola, Junyi Peng, Themos Stafylakis, Dmitriy Beveraki, Anna Silnova, Jan Brukner, Lukáš Burget
Publicado en: The Automatic Speaker Verification Spoofing Countermeasures Workshop (ASVspoof 2024), 2024
Editor: ISCA
DOI: 10.21437/ASVSPOOF.2024-4

TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR (se abrirá en una nueva ventana)

Autores: Shashi Kumar, Srikanth Madikeri, Juan Pablo Zuluaga Gomez, Iuliia Thorbecke, Esaú Villatoro-tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S, Aravind Ganapathiraju
Publicado en: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.1167

Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units (se abrirá en una nueva ventana)

Autores: Bolaji Yusuf, Jan Honza Cernocky, Murat Saraçlar
Publicado en: Interspeech 2024, 2024
Editor: ISCA
DOI: 10.21437/INTERSPEECH.2024-1713

Parameter-Efficient Transfer Learning of Audio Spectrogram Transformers (se abrirá en una nueva ventana)

Autores: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti, Mirco Ravanelli
Publicado en: 2024 IEEE 34th International Workshop on Machine Learning for Signal Processing (MLSP), 2024
Editor: IEEE
DOI: 10.1109/MLSP58920.2024.10734776

Multitask Speech Recognition and Speaker Change Detection for Unknown Number of Speakers (se abrirá en una nueva ventana)

Autores: Shashi Kumar, Srikanth Madikeri, Iuliia Nigmatulina, Esaú Villatoro-Tello, Petr Motlicek, Karthik Pandia, S. Pavankumar Dubagunta, Aravind Ganapathiraju
Publicado en: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024
Editor: IEEE
DOI: 10.1109/ICASSP48485.2024.10446130

Large Language Models are Strong Audio-Visual Speech Recognition Learners (se abrirá en una nueva ventana)

Autores: Umberto Cappellazzo, Minsu Kim, Honglie Chen, Pingchuan Ma, Stavros Petridis, Daniele Falavigna, Alessio Brutti, Maja Pantic
Publicado en: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Editor: IEEE
DOI: 10.1109/ICASSP49660.2025.10889251

Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction (se abrirá en una nueva ventana)

Autores: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek
Publicado en: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.310

Multimodal Emotion Recognition Using Compressed Graph Neural Networks (se abrirá en una nueva ventana)

Autores: Tijana Đurkić, Nikola Simić, Siniša Suzić, Dragana Bajović, Zoran Perić, Vlado Delić
Publicado en: Lecture Notes in Computer Science, Speech and Computer, 2025
Editor: Springer Nature Switzerland
DOI: 10.1007/978-3-031-78014-1_9

BUT/JHU System Description for CHiME-8 NOTSOFAR-1 Challenge (se abrirá en una nueva ventana)

Autores: Alexander Polok, Dominik Klement, Jiangyu Han, Šimon Sedláček, Bolaji Yusuf, Matthew Maciejewski, Matthew S Wiesner, Lukáš Burget
Publicado en: 8th International Workshop on Speech Processing in Everyday Environments (CHiME 2024), 2024
Editor: ISCA
DOI: 10.21437/CHIME.2024-4

Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters (se abrirá en una nueva ventana)

Autores: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti
Publicado en: Interspeech 2024, 2024
Editor: ISCA
DOI: 10.21437/INTERSPEECH.2024-38

MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation (se abrirá en una nueva ventana)

Autores: Javier García Gilabert, Carlos Escolano, Audrey Mash, Xixian Liao, Maite Melero
Publicado en: Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (System Demonstrations), 2025
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2025.NAACL-DEMO.6

Buscando datos de OpenAIRE...

Se ha producido un error en la búsqueda de datos de OpenAIRE

No hay resultados disponibles

Mi folleto 0 0