Multilingual and Cross-cultural interactions for context-aware, and bias-controlled dialogue systems for safety-critical applications

Informations projet

ELOQUENCE

N° de convention de subvention: 101135916

DOI

10.3030/101135916

Date de signature de la CE 29 Novembre 2023

Date de début 1 Janvier 2024

Date de fin 31 Decembre 2026

Financé au titre de

Digital, Industry and Space

Coût total

€ 5 072 543,75

Contribution de l’UE

€ 5 072 543,75

5 072 543,75

Coordonné par

TELEFONICA INNOVACION DIGITAL SL
Spain

CORDIS fournit des liens vers les livrables publics et les publications des projets HORIZON.

Les liens vers les livrables et les publications des projets du 7e PC, ainsi que les liens vers certains types de résultats spécifiques tels que les jeux de données et les logiciels, sont récupérés dynamiquement sur OpenAIRE .

Livrables

Emerging ELOQUENCE technology- approved by the ELOQUENCE Community

Finalized at TLR=3 stage, this report assesses emerging ELOQUENCE outputs as being respectful of EU values, with particular emphasis on gender, cultural or racial biases.

Dissemination, Communication and Exploitation Plan

Overall DEC plan, with KPIs and benchmarks, and campaign planning. Also includes the website.

Ethics Compliance Management Report

The Ethics requirements and compliance methodology for responsible research.

Algorithms definition, baselines, open issues and use cases

Methodologies applied for both knowledge-based approaches and semi-supervised learning, and applicability to use cases.

Retrieval model for conversational style queries

The methodologies of integrating conversational LLM with FIR subsystem, discussion of open research questions in the context of ELOQUENCE. Codebase implementing the FIR, evaluation of the FIR precision given conversational queries.

Dissemination, Communication and Exploitation Plan II

Overall DEC plan, with KPIs and benchmarks, and campaign planning. Also includes the website.

Conversational LLM

Methodologies for LLM finetuning and simulation/ augmentation of conversational training data, and applicability to use cases. Comparison with SOTA models. Codebase implementing the fine-tuning on selected datasets.

Report on linguistic expression respectful of EU values

Report on requirements for machine-generated verbal communication respectful of European values as enshrined in Article 2 of the EU Treaty.

Pilot Requirements & Usability Evaluation

Uses cases, requirements and outcomes for the different pilots. Summary of the set of KPIs, criteria and methodology to evaluate the ELOQUENCE usability.

Open source datasets suitable for semi-structured, unstructured and multi-turn conversations

Requirements for semi-structured, multi-turn and unstructured dialogues, available/relevant literature review on evaluation of dialogues and description of methodology on how the fused datasets are generated

Project Management Handbook

Management procedure, consortium communication tools and the quality and risk management plans.

Methodology for jointly training FIR and response generator

The methodologies on interconnecting FIR and response generator, analysis of scenarios relevant to ELOQUENCE. Implementation of the FIR and response generator joint training.

ELOQUENCE DMP

The legal aspects and the data management plan for the collection and processing of data throughout the project activities.

ELOQUENCE DMP II

The legal aspects and the data management plan for the collection and processing of data throughout the project activities.

Publications

Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems

Auteurs: Christos Vlachos, Themos Stafylakis, Ion Androutsopoulos
Publié dans: Findings of the Association for Computational Linguistics ACL 2024, 2024
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2024.FINDINGS-ACL.431

BESST Dataset: A Multimodal Resource for Speech-based Stress Detection and Analysis

Auteurs: Jan Pešán, Vojtěch Juřík, Martin Karafiát, Jan Černocký
Publié dans: Interspeech 2024, 2024
Éditeur: ISCA
DOI: 10.21437/INTERSPEECH.2024-42

BUT systems and analyses for the ASVspoof 5 Challenge

Auteurs: Johan Rohdin, Lin Zhang, Plchot Oldřich, Vojtěch Staněk, David Mihola, Junyi Peng, Themos Stafylakis, Dmitriy Beveraki, Anna Silnova, Jan Brukner, Lukáš Burget
Publié dans: The Automatic Speaker Verification Spoofing Countermeasures Workshop (ASVspoof 2024), 2024
Éditeur: ISCA
DOI: 10.21437/ASVSPOOF.2024-4

High-probability Convergence Bounds for Online Nonlinear Stochastic Gradient Descent under Heavy-tailed Noise

Auteurs: Aleksandar Armacki, Shuhua Yu, Pranay Sharma, Gauri Joshi, Dragana Bajović, Dušan Jakovetić, Soummya Kar
Publié dans: Proceedings of the 28th International Conference on Artificial Intelligence and Statistics (AISTATS), PMLR
Éditeur: PMLR

TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR

Auteurs: Shashi Kumar, Srikanth Madikeri, Juan Pablo Zuluaga Gomez, Iuliia Thorbecke, Esaú Villatoro-tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S, Aravind Ganapathiraju
Publié dans: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.1167

Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units

Auteurs: Bolaji Yusuf, Jan Honza Cernocky, Murat Saraçlar
Publié dans: Interspeech 2024, 2024
Éditeur: ISCA
DOI: 10.21437/INTERSPEECH.2024-1713

Parameter-Efficient Transfer Learning of Audio Spectrogram Transformers

Auteurs: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti, Mirco Ravanelli
Publié dans: 2024 IEEE 34th International Workshop on Machine Learning for Signal Processing (MLSP), 2024
Éditeur: IEEE
DOI: 10.1109/MLSP58920.2024.10734776

Multitask Speech Recognition and Speaker Change Detection for Unknown Number of Speakers

Auteurs: Shashi Kumar, Srikanth Madikeri, Iuliia Nigmatulina, Esaú Villatoro-Tello, Petr Motlicek, Karthik Pandia, S. Pavankumar Dubagunta, Aravind Ganapathiraju
Publié dans: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024
Éditeur: IEEE
DOI: 10.1109/ICASSP48485.2024.10446130

On the Relationship of Social Gender Equality and Grammatical Gender in Pre-trained Large Language Models

Auteurs: Magdalena Biesialska, David Solans, Jordi Luque and Carlos Segura
Éditeur: CEUR-WS.org

Large Language Models are Strong Audio-Visual Speech Recognition Learners

Auteurs: Umberto Cappellazzo, Minsu Kim, Honglie Chen, Pingchuan Ma, Stavros Petridis, Daniele Falavigna, Alessio Brutti, Maja Pantic
Publié dans: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Éditeur: IEEE
DOI: 10.1109/ICASSP49660.2025.10889251

Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction

Auteurs: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek
Publié dans: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.310

BUT/JHU System Description for CHiME-8 NOTSOFAR-1 Challenge

Auteurs: Alexander Polok, Dominik Klement, Jiangyu Han, Šimon Sedláček, Bolaji Yusuf, Matthew Maciejewski, Matthew S Wiesner, Lukáš Burget
Publié dans: 8th International Workshop on Speech Processing in Everyday Environments (CHiME 2024), 2024
Éditeur: ISCA
DOI: 10.21437/CHIME.2024-4

Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters

Auteurs: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti
Publié dans: Interspeech 2024, 2024
Éditeur: ISCA
DOI: 10.21437/INTERSPEECH.2024-38

Graph of Goal-Oriented Thoughts: Design and Implementation of LLM Agents

Auteurs: Dario Badagliacca, Gabriele Caruso, Agnese Augello, Luca Sabatucci
Éditeur: CEUR-WS.org

MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation

Auteurs: Javier García Gilabert, Carlos Escolano, Audrey Mash, Xixian Liao, Maite Melero
Publié dans: Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (System Demonstrations), 2025
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2025.NAACL-DEMO.6

Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models

Auteurs: Olga Loginova, Oleksandr Bezrukov, Ravi Shekhar, Alexey Kravets
Publié dans: Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025
Éditeur: Association for Computational Linguistics
DOI: 10.18653/V1/2025.ACL-LONG.162

Recherche de données OpenAIRE...

Livrables

Publications

Télécharger Télécharger le contenu de la page