Descripción del proyecto
Detectar palabras clave con la mira puesta en el presente y el futuro
La localización de palabras clave (KWS, por sus siglas en inglés), la identificación de palabras clave de una secuencia de audio que incluye voz, es una tecnología de voz esencial que se aplicó en diversos dispositivos electrónicos con integración de voz. Aunque el rendimiento de las tecnologías del habla se mejora cada vez más, aún no se ha podido solucionar el problema de la degradación de la calidad debido a las distorsiones acústicas. El equipo del proyecto AGILE-KWS, financiado con fondos europeos, aspira a mejorar la tecnología de KWS mediante la investigación y el desarrollo de métodos innovadores de última generación que superen la distorsión acústica. En el proyecto AGILE-KWS se utilizarán conceptos que han sido empleados con éxito en el reconocimiento automático del habla para ampliar el rendimiento de la KWS en situaciones acústicas del mundo real. Se centrarán en la conservación de las grabaciones de voz de la misión Apolo de la NASA y la mejora de la interacción basada en la voz con dispositivos de ayuda auditiva.
Objetivo
Speech technologies like keyword spotting (KWS), which is concerned with the detection of keywords from an audio stream comprising speech, are nowadays in vogue thanks to their integration in many electronic devices in order to comfortably interact with them by means of the voice. Despite all the research progress made over the last decades, the performance of speech technologies is still severely degraded when acoustic distortions like background noise or reverberation are present. This can make these technologies completely unusable for the real-world applications. As a result, this project proposal aims at taking KWS technology forward by researching and developing novel state-of-the-art acoustic distortion-robust methods based on concepts successfully applied to related areas like automatic speech recognition to get a leap of KWS performance in real-world (i.e. noisy) acoustic conditions. This will be achieved while working towards two different and exciting timely goals with high social impact giving an interdisciplinary dimension to this action: 1) the preservation of the NASA’s Apollo mission speech recordings for future generations (during the outgoing phase), and 2) the improvement of hearing-impaired people’s life quality by facilitating voice-based interaction with hearing assistive devices like hearing aids (during the incoming phase).
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véase: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural. Véase: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
Para utilizar esta función, debe iniciar sesión o registrarse
Le pedimos disculpas, pero se ha producido un error inesperado durante la ejecución.
Necesita estar autentificado. Puede que su sesión haya finalizado.
Gracias por su comentario. En breve recibirá un correo electrónico para confirmar el envío. Si ha seleccionado que se le notifique sobre el estado del informe, también se le contactará cuando el estado del informe cambie.
Palabras clave
Programa(s)
- HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) Main Programme
Convocatoria de propuestas
(se abrirá en una nueva ventana) HORIZON-MSCA-2021-PF-01
Consulte otros proyectos de esta convocatoriaRégimen de financiación
HORIZON-TMA-MSCA-PF-GF -Coordinador
9220 Aalborg
Dinamarca