Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

A Giant Leap for Keyword Spotting

Descripción del proyecto

Detectar palabras clave con la mira puesta en el presente y el futuro

La localización de palabras clave (KWS, por sus siglas en inglés), la identificación de palabras clave de una secuencia de audio que incluye voz, es una tecnología de voz esencial que se aplicó en diversos dispositivos electrónicos con integración de voz. Aunque el rendimiento de las tecnologías del habla se mejora cada vez más, aún no se ha podido solucionar el problema de la degradación de la calidad debido a las distorsiones acústicas. El equipo del proyecto AGILE-KWS, financiado con fondos europeos, aspira a mejorar la tecnología de KWS mediante la investigación y el desarrollo de métodos innovadores de última generación que superen la distorsión acústica. En el proyecto AGILE-KWS se utilizarán conceptos que han sido empleados con éxito en el reconocimiento automático del habla para ampliar el rendimiento de la KWS en situaciones acústicas del mundo real. Se centrarán en la conservación de las grabaciones de voz de la misión Apolo de la NASA y la mejora de la interacción basada en la voz con dispositivos de ayuda auditiva.

Objetivo

Speech technologies like keyword spotting (KWS), which is concerned with the detection of keywords from an audio stream comprising speech, are nowadays in vogue thanks to their integration in many electronic devices in order to comfortably interact with them by means of the voice. Despite all the research progress made over the last decades, the performance of speech technologies is still severely degraded when acoustic distortions like background noise or reverberation are present. This can make these technologies completely unusable for the real-world applications. As a result, this project proposal aims at taking KWS technology forward by researching and developing novel state-of-the-art acoustic distortion-robust methods based on concepts successfully applied to related areas like automatic speech recognition to get a leap of KWS performance in real-world (i.e. noisy) acoustic conditions. This will be achieved while working towards two different and exciting timely goals with high social impact giving an interdisciplinary dimension to this action: 1) the preservation of the NASA’s Apollo mission speech recordings for future generations (during the outgoing phase), and 2) the improvement of hearing-impaired people’s life quality by facilitating voice-based interaction with hearing assistive devices like hearing aids (during the incoming phase).

Coordinador

AALBORG UNIVERSITET
Aportación neta de la UEn
€ 286 191,36
Dirección
FREDRIK BAJERS VEJ 7K
9220 Aalborg
Dinamarca

Ver en el mapa

Región
Danmark Nordjylland Nordjylland
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total
Sin datos

Socios (1)