Descrizione del progetto
Individuare parole chiave con lo sguardo rivolto al presente e al futuro
L’individuazione di parole chiave, ossia l’identificazione di parole chiave da un flusso audio che include il parlato, è una tecnologia vocale cruciale attuata in una vasta gamma di dispositivi elettronici che si avvalgono dell’integrazione vocale. Nonostante le continue migliorie apportate alle prestazioni delle tecnologie vocali, resta il problema del degrado della qualità dovuto alle distorsioni acustiche. Il progetto AGILE-KWS, finanziato dall’UE, aspira a far progredire la tecnologia di individuazione di parole chiave ricercando e sviluppando metodi innovativi e avanzati a prova di distorsione acustica. AGILE-KWS si avvarrà di concetti applicati con successo al riconoscimento vocale automatico per ampliare le prestazioni dell’individuazione di parole chiave in condizioni acustiche reali. L’attenzione è rivolta alla conservazione delle registrazioni vocali della missione Apollo della NASA e al potenziamento dell’interazione basata sulla voce con i dispositivi di assistenza dell’udito.
Obiettivo
Speech technologies like keyword spotting (KWS), which is concerned with the detection of keywords from an audio stream comprising speech, are nowadays in vogue thanks to their integration in many electronic devices in order to comfortably interact with them by means of the voice. Despite all the research progress made over the last decades, the performance of speech technologies is still severely degraded when acoustic distortions like background noise or reverberation are present. This can make these technologies completely unusable for the real-world applications. As a result, this project proposal aims at taking KWS technology forward by researching and developing novel state-of-the-art acoustic distortion-robust methods based on concepts successfully applied to related areas like automatic speech recognition to get a leap of KWS performance in real-world (i.e. noisy) acoustic conditions. This will be achieved while working towards two different and exciting timely goals with high social impact giving an interdisciplinary dimension to this action: 1) the preservation of the NASA’s Apollo mission speech recordings for future generations (during the outgoing phase), and 2) the improvement of hearing-impaired people’s life quality by facilitating voice-based interaction with hearing assistive devices like hearing aids (during the incoming phase).
Parole chiave
Programma(i)
- HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) Main Programme
Meccanismo di finanziamento
HORIZON-TMA-MSCA-PF-GF - HORIZON TMA MSCA Postdoctoral Fellowships - Global FellowshipsCoordinatore
9220 Aalborg
Danimarca