Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Multilingual and Cross-cultural interactions for context-aware, and bias-controlled dialogue systems for safety-critical applications

CORDIS oferuje możliwość skorzystania z odnośników do publicznie dostępnych publikacji i rezultatów projektów realizowanych w ramach programów ramowych HORYZONT.

Odnośniki do rezultatów i publikacji związanych z poszczególnymi projektami 7PR, a także odnośniki do niektórych konkretnych kategorii wyników, takich jak zbiory danych i oprogramowanie, są dynamicznie pobierane z systemu OpenAIRE .

Publikacje

Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems (odnośnik otworzy się w nowym oknie)

Autorzy: Christos Vlachos, Themos Stafylakis, Ion Androutsopoulos
Opublikowane w: Findings of the Association for Computational Linguistics ACL 2024, 2024
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2024.FINDINGS-ACL.431

BESST Dataset: A Multimodal Resource for Speech-based Stress Detection and Analysis (odnośnik otworzy się w nowym oknie)

Autorzy: Jan Pešán, Vojtěch Juřík, Martin Karafiát, Jan Černocký
Opublikowane w: Interspeech 2024, 2024
Wydawca: ISCA
DOI: 10.21437/INTERSPEECH.2024-42

BUT systems and analyses for the ASVspoof 5 Challenge (odnośnik otworzy się w nowym oknie)

Autorzy: Johan Rohdin, Lin Zhang, Plchot Oldřich, Vojtěch Staněk, David Mihola, Junyi Peng, Themos Stafylakis, Dmitriy Beveraki, Anna Silnova, Jan Brukner, Lukáš Burget
Opublikowane w: The Automatic Speaker Verification Spoofing Countermeasures Workshop (ASVspoof 2024), 2024
Wydawca: ISCA
DOI: 10.21437/ASVSPOOF.2024-4

TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR (odnośnik otworzy się w nowym oknie)

Autorzy: Shashi Kumar, Srikanth Madikeri, Juan Pablo Zuluaga Gomez, Iuliia Thorbecke, Esaú Villatoro-tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S, Aravind Ganapathiraju
Opublikowane w: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.1167

Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units (odnośnik otworzy się w nowym oknie)

Autorzy: Bolaji Yusuf, Jan Honza Cernocky, Murat Saraçlar
Opublikowane w: Interspeech 2024, 2024
Wydawca: ISCA
DOI: 10.21437/INTERSPEECH.2024-1713

Parameter-Efficient Transfer Learning of Audio Spectrogram Transformers (odnośnik otworzy się w nowym oknie)

Autorzy: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti, Mirco Ravanelli
Opublikowane w: 2024 IEEE 34th International Workshop on Machine Learning for Signal Processing (MLSP), 2024
Wydawca: IEEE
DOI: 10.1109/MLSP58920.2024.10734776

Multitask Speech Recognition and Speaker Change Detection for Unknown Number of Speakers (odnośnik otworzy się w nowym oknie)

Autorzy: Shashi Kumar, Srikanth Madikeri, Iuliia Nigmatulina, Esaú Villatoro-Tello, Petr Motlicek, Karthik Pandia, S. Pavankumar Dubagunta, Aravind Ganapathiraju
Opublikowane w: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024
Wydawca: IEEE
DOI: 10.1109/ICASSP48485.2024.10446130

Large Language Models are Strong Audio-Visual Speech Recognition Learners (odnośnik otworzy się w nowym oknie)

Autorzy: Umberto Cappellazzo, Minsu Kim, Honglie Chen, Pingchuan Ma, Stavros Petridis, Daniele Falavigna, Alessio Brutti, Maja Pantic
Opublikowane w: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Wydawca: IEEE
DOI: 10.1109/ICASSP49660.2025.10889251

Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction (odnośnik otworzy się w nowym oknie)

Autorzy: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek
Opublikowane w: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.310

Multimodal Emotion Recognition Using Compressed Graph Neural Networks (odnośnik otworzy się w nowym oknie)

Autorzy: Tijana Đurkić, Nikola Simić, Siniša Suzić, Dragana Bajović, Zoran Perić, Vlado Delić
Opublikowane w: Lecture Notes in Computer Science, Speech and Computer, 2025
Wydawca: Springer Nature Switzerland
DOI: 10.1007/978-3-031-78014-1_9

BUT/JHU System Description for CHiME-8 NOTSOFAR-1 Challenge (odnośnik otworzy się w nowym oknie)

Autorzy: Alexander Polok, Dominik Klement, Jiangyu Han, Šimon Sedláček, Bolaji Yusuf, Matthew Maciejewski, Matthew S Wiesner, Lukáš Burget
Opublikowane w: 8th International Workshop on Speech Processing in Everyday Environments (CHiME 2024), 2024
Wydawca: ISCA
DOI: 10.21437/CHIME.2024-4

Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters (odnośnik otworzy się w nowym oknie)

Autorzy: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti
Opublikowane w: Interspeech 2024, 2024
Wydawca: ISCA
DOI: 10.21437/INTERSPEECH.2024-38

MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation (odnośnik otworzy się w nowym oknie)

Autorzy: Javier García Gilabert, Carlos Escolano, Audrey Mash, Xixian Liao, Maite Melero
Opublikowane w: Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (System Demonstrations), 2025
Wydawca: Association for Computational Linguistics
DOI: 10.18653/V1/2025.NAACL-DEMO.6

Wyszukiwanie danych OpenAIRE...

Podczas wyszukiwania danych OpenAIRE wystąpił błąd

Brak wyników

Moja broszura 0 0