Description du projet
Détecter les mots-clés en tenant compte du présent et du futur
Le repérage de mots-clés (KWS), la détection de mots-clés à partir d’un flux audio comprenant de la parole, est une technologie vocale pivot mise en œuvre dans une variété de dispositifs électroniques qui utilisent l’intégration vocale. Bien que les performances des technologies vocales soient de plus en plus hautes, le problème de la dégradation de la qualité due aux distorsions acoustiques demeure. Le projet AGILE-KWS, financé par l’UE, vise à faire progresser la technologie du KWS en recherchant et en développant des méthodes innovantes et de pointe pour éviter les distorsions acoustiques. AGILE-KWS utilisera des concepts appliqués avec succès à la reconnaissance automatique de la parole pour étendre les performances de KWS dans des conditions acoustiques réelles. Le projet travaille notamment à la préservation des enregistrements vocaux de la mission Apollo de la NASA et à la mise à niveau de l’interaction vocale avec les appareils d’assistance auditive.
Objectif
Speech technologies like keyword spotting (KWS), which is concerned with the detection of keywords from an audio stream comprising speech, are nowadays in vogue thanks to their integration in many electronic devices in order to comfortably interact with them by means of the voice. Despite all the research progress made over the last decades, the performance of speech technologies is still severely degraded when acoustic distortions like background noise or reverberation are present. This can make these technologies completely unusable for the real-world applications. As a result, this project proposal aims at taking KWS technology forward by researching and developing novel state-of-the-art acoustic distortion-robust methods based on concepts successfully applied to related areas like automatic speech recognition to get a leap of KWS performance in real-world (i.e. noisy) acoustic conditions. This will be achieved while working towards two different and exciting timely goals with high social impact giving an interdisciplinary dimension to this action: 1) the preservation of the NASA’s Apollo mission speech recordings for future generations (during the outgoing phase), and 2) the improvement of hearing-impaired people’s life quality by facilitating voice-based interaction with hearing assistive devices like hearing aids (during the incoming phase).
Champ scientifique
Mots‑clés
Programme(s)
- HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) Main Programme
Régime de financement
HORIZON-TMA-MSCA-PF-GF - HORIZON TMA MSCA Postdoctoral Fellowships - Global FellowshipsCoordinateur
9220 Aalborg
Danemark