Multilingual and Cross-cultural interactions for context-aware, and bias-controlled dialogue systems for safety-critical applications

Información del proyecto

ELOQUENCE

Identificador del acuerdo de subvención: 101135916

DOI

10.3030/101135916

Fecha de la firma de la CE 29 Noviembre 2023

Fecha de inicio 1 Enero 2024

Fecha de finalización 31 Diciembre 2026

Financiado con arreglo a

Digital, Industry and Space

Coste total

€ 5 072 543,75

Aportación de la UE

€ 5 072 543,75

5 072 543,75

Coordinado por

TELEFONICA INNOVACION DIGITAL SL
Spain

CORDIS proporciona enlaces a los documentos públicos y las publicaciones de los proyectos de los programas marco HORIZONTE.

Los enlaces a los documentos y las publicaciones de los proyectos del Séptimo Programa Marco, así como los enlaces a algunos tipos de resultados específicos, como conjuntos de datos y «software», se obtienen dinámicamente de OpenAIRE .

Resultado final

Emerging ELOQUENCE technology- approved by the ELOQUENCE Community

Finalized at TLR=3 stage, this report assesses emerging ELOQUENCE outputs as being respectful of EU values, with particular emphasis on gender, cultural or racial biases.

Dissemination, Communication and Exploitation Plan

Overall DEC plan, with KPIs and benchmarks, and campaign planning. Also includes the website.

Ethics Compliance Management Report

The Ethics requirements and compliance methodology for responsible research.

Algorithms definition, baselines, open issues and use cases

Methodologies applied for both knowledge-based approaches and semi-supervised learning, and applicability to use cases.

Retrieval model for conversational style queries

The methodologies of integrating conversational LLM with FIR subsystem, discussion of open research questions in the context of ELOQUENCE. Codebase implementing the FIR, evaluation of the FIR precision given conversational queries.

Dissemination, Communication and Exploitation Plan II

Overall DEC plan, with KPIs and benchmarks, and campaign planning. Also includes the website.

Conversational LLM

Methodologies for LLM finetuning and simulation/ augmentation of conversational training data, and applicability to use cases. Comparison with SOTA models. Codebase implementing the fine-tuning on selected datasets.

Report on linguistic expression respectful of EU values

Report on requirements for machine-generated verbal communication respectful of European values as enshrined in Article 2 of the EU Treaty.

Pilot Requirements & Usability Evaluation

Uses cases, requirements and outcomes for the different pilots. Summary of the set of KPIs, criteria and methodology to evaluate the ELOQUENCE usability.

Open source datasets suitable for semi-structured, unstructured and multi-turn conversations

Requirements for semi-structured, multi-turn and unstructured dialogues, available/relevant literature review on evaluation of dialogues and description of methodology on how the fused datasets are generated

Project Management Handbook

Management procedure, consortium communication tools and the quality and risk management plans.

Methodology for jointly training FIR and response generator

The methodologies on interconnecting FIR and response generator, analysis of scenarios relevant to ELOQUENCE. Implementation of the FIR and response generator joint training.

ELOQUENCE DMP

The legal aspects and the data management plan for the collection and processing of data throughout the project activities.

ELOQUENCE DMP II

The legal aspects and the data management plan for the collection and processing of data throughout the project activities.

Publicaciones

Comparing Data Augmentation Methods for End-to-End Task-Oriented Dialog Systems

Autores: Christos Vlachos, Themos Stafylakis, Ion Androutsopoulos
Publicado en: Findings of the Association for Computational Linguistics ACL 2024, 2024
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2024.FINDINGS-ACL.431

BESST Dataset: A Multimodal Resource for Speech-based Stress Detection and Analysis

Autores: Jan Pešán, Vojtěch Juřík, Martin Karafiát, Jan Černocký
Publicado en: Interspeech 2024, 2024
Editor: ISCA
DOI: 10.21437/INTERSPEECH.2024-42

BUT systems and analyses for the ASVspoof 5 Challenge

Autores: Johan Rohdin, Lin Zhang, Plchot Oldřich, Vojtěch Staněk, David Mihola, Junyi Peng, Themos Stafylakis, Dmitriy Beveraki, Anna Silnova, Jan Brukner, Lukáš Burget
Publicado en: The Automatic Speaker Verification Spoofing Countermeasures Workshop (ASVspoof 2024), 2024
Editor: ISCA
DOI: 10.21437/ASVSPOOF.2024-4

High-probability Convergence Bounds for Online Nonlinear Stochastic Gradient Descent under Heavy-tailed Noise

Autores: Aleksandar Armacki, Shuhua Yu, Pranay Sharma, Gauri Joshi, Dragana Bajović, Dušan Jakovetić, Soummya Kar
Publicado en: Proceedings of the 28th International Conference on Artificial Intelligence and Statistics (AISTATS), PMLR
Editor: PMLR

TokenVerse: Towards Unifying Speech and NLP Tasks via Transducer-based ASR

Autores: Shashi Kumar, Srikanth Madikeri, Juan Pablo Zuluaga Gomez, Iuliia Thorbecke, Esaú Villatoro-tello, Sergio Burdisso, Petr Motlicek, Karthik Pandia D S, Aravind Ganapathiraju
Publicado en: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.1167

Pretraining End-to-End Keyword Search with Automatically Discovered Acoustic Units

Autores: Bolaji Yusuf, Jan Honza Cernocky, Murat Saraçlar
Publicado en: Interspeech 2024, 2024
Editor: ISCA
DOI: 10.21437/INTERSPEECH.2024-1713

Parameter-Efficient Transfer Learning of Audio Spectrogram Transformers

Autores: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti, Mirco Ravanelli
Publicado en: 2024 IEEE 34th International Workshop on Machine Learning for Signal Processing (MLSP), 2024
Editor: IEEE
DOI: 10.1109/MLSP58920.2024.10734776

Multitask Speech Recognition and Speaker Change Detection for Unknown Number of Speakers

Autores: Shashi Kumar, Srikanth Madikeri, Iuliia Nigmatulina, Esaú Villatoro-Tello, Petr Motlicek, Karthik Pandia, S. Pavankumar Dubagunta, Aravind Ganapathiraju
Publicado en: ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2024
Editor: IEEE
DOI: 10.1109/ICASSP48485.2024.10446130

On the Relationship of Social Gender Equality and Grammatical Gender in Pre-trained Large Language Models

Autores: Magdalena Biesialska, David Solans, Jordi Luque and Carlos Segura
Editor: CEUR-WS.org

Large Language Models are Strong Audio-Visual Speech Recognition Learners

Autores: Umberto Cappellazzo, Minsu Kim, Honglie Chen, Pingchuan Ma, Stavros Petridis, Daniele Falavigna, Alessio Brutti, Maja Pantic
Publicado en: ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025
Editor: IEEE
DOI: 10.1109/ICASSP49660.2025.10889251

Dialog2Flow: Pre-training Soft-Contrastive Action-Driven Sentence Embeddings for Automatic Dialog Flow Extraction

Autores: Sergio Burdisso, Srikanth Madikeri, Petr Motlicek
Publicado en: Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2024.EMNLP-MAIN.310

BUT/JHU System Description for CHiME-8 NOTSOFAR-1 Challenge

Autores: Alexander Polok, Dominik Klement, Jiangyu Han, Šimon Sedláček, Bolaji Yusuf, Matthew Maciejewski, Matthew S Wiesner, Lukáš Burget
Publicado en: 8th International Workshop on Speech Processing in Everyday Environments (CHiME 2024), 2024
Editor: ISCA
DOI: 10.21437/CHIME.2024-4

Efficient Fine-tuning of Audio Spectrogram Transformers via Soft Mixture of Adapters

Autores: Umberto Cappellazzo, Daniele Falavigna, Alessio Brutti
Publicado en: Interspeech 2024, 2024
Editor: ISCA
DOI: 10.21437/INTERSPEECH.2024-38

Graph of Goal-Oriented Thoughts: Design and Implementation of LLM Agents

Autores: Dario Badagliacca, Gabriele Caruso, Agnese Augello, Luca Sabatucci
Editor: CEUR-WS.org

MT-LENS: An all-in-one Toolkit for Better Machine Translation Evaluation

Autores: Javier García Gilabert, Carlos Escolano, Audrey Mash, Xixian Liao, Maite Melero
Publicado en: Proceedings of the 2025 Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics: Human Language Technologies (System Demonstrations), 2025
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2025.NAACL-DEMO.6

Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models

Autores: Olga Loginova, Oleksandr Bezrukov, Ravi Shekhar, Alexey Kravets
Publicado en: Proceedings of the 63rd Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2025
Editor: Association for Computational Linguistics
DOI: 10.18653/V1/2025.ACL-LONG.162

Buscando datos de OpenAIRE...

Resultado final

Publicaciones

Descargar Descargar el contenido de la página