Skip to main content
Vai all'homepage della Commissione europea (si apre in una nuova finestra)
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS
Contenuto archiviato il 2024-05-24
Speech Driven Multi-modal Automatic Directory Assistance

Article Category

Article available in the following languages:

Nuovi standard europei per il riconoscimento vocale

Con l'attuale trasferimento delle tecnologie di riconoscimento vocale e di linguaggio parlato in applicazioni reali, è diventato urgente poter disporre di un valido sistema di riconoscimento vocale. Il progetto SMADA, finanziato dall'UE, ha sviluppato una tecnologia che migliora sensibilmente il riconoscimento del linguaggio diffuso su reti mobili.

Le prestazioni dei sistemi di riconoscimento vocale tendono a deteriorarsi sulle linee telefoniche, se altre persone stanno parlando nelle vicinanze del microfono o se colui che parla ha una cadenza marcata. Il progetto SMADA ha contribuito attivamente a definire un nuovo standard europeo per front-end anti interferenze destinati alla DSR (Distributed Speech Recognition), che migliora sensibilmente la robustezza e accuratezza dell'ASR (Automatic Speech Recognition) in condizioni reali e permette il riconoscimento vocale diffuso su reti mobili. Con un metodo efficiente di riduzione del rumore, la DSR può migliorare la qualità del segnale vocale, riducendo gli effetti degli ambienti rumorosi, dei limiti di larghezza di banda, della codec (codifica e decodifica) e degli errori di trasmissione, tutti fenomeni che degradano le prestazioni del sistema di riconoscimento. Lo standard formale, uno dei più importanti risultati del progetto pubblicato nell'ottobre 2002 dall'ETSI (European Telecommunications Standards Institute), viene attualmente discusso e valutato nel quadro del progetto 3GPP (Third Generation Partnership Project) per essere adottato come componente di codec per difetto nei servizi speech-enabled delle reti senza fili della terza generazione (3G). Questo risultato del progetto SMADA potrebbe risultare particolarmente utile a medio e lungo termine, quando le reti mobili a 2,5G e 3G renderanno disponibili i servizi speech-enabled e multimodali.

Scopri altri articoli nello stesso settore di applicazione

Il mio fascicolo 0 0