European Commission logo
italiano italiano
CORDIS - Risultati della ricerca dell’UE
CORDIS

Accessible Voice-Activated Technologies in a Voice-First World

Article Category

Article available in the following languages:

Una tecnologia vocale inclusiva basata sull’intelligenza artificiale per le persone con disturbi del linguaggio

Come possiamo dare accesso alla tecnologia vocale a chi ne ha più bisogno? Il progetto NUVOIC, finanziato dall’UE, fornisce una tecnologia vocale basata sull’intelligenza artificiale per le persone con disturbi del linguaggio, consentendo una maggiore indipendenza ai soggetti affetti da disabilità motorie e linguistiche.

Economia digitale icon Economia digitale

La tecnologia vocale è in piena espansione. Secondo un sondaggio effettuato nel 2023, più di 8 imprenditori su 10 la impiegano nella loro organizzazione. Utilizziamo sempre più spesso il riconoscimento vocale automatico per interagire con gli assistenti virtuali e la tecnologia domestica, per effettuare ricerche e acquisti online e per trascrivere le parole pronunciate. Finora questa rivoluzione non è stata di tipo inclusivo. «Ironia della sorte, molti di coloro che hanno più bisogno di queste tecnologie, per esempio le persone con disabilità che necessitano di aiuto per spegnere le luci o accendere la TV, non possono accedervi perché sono affetti anche da disturbi del linguaggio», afferma Sara Smolley, vicepresidente e co-fondatrice della start-up Voiceitt, specializzata in riconoscimento vocale automatico. Le persone che presentano alterazioni del linguaggio costituiscono una comunità eterogenea che comprende, ad esempio, pazienti affetti da sindrome di Down e paralisi cerebrale, ma anche molti adulti anziani. Grazie al progetto NUVOIC, finanziato dall’UE, Voiceitt sta permettendo a numerosi individui facenti parte di questo gruppo diversificato di interagire ed esprimersi secondo nuove modalità. NUVOIC sta per «new voice», ovvero nuova voce. L’obiettivo del progetto era duplice, spiega Smolley: «Volevamo consentire alle persone affette da disabilità vocali di esprimersi liberamente, offrendo loro una maggiore indipendenza mediante l’accesso alla tecnologia vocale alimentata dall’intelligenza artificiale.»

Un balzo tecnologico in avanti

La tecnologia di prima generazione di Voiceitt offriva agli utenti la possibilità di addestrare un’applicazione su frasi di uso quotidiano, da utilizzare successivamente per esprimersi. Con il nuovo finanziamento di progetto nell’ambito di NUVOIC, il team è riuscito a portare questa idea al livello successivo. La nuova applicazione basata sul web di Voiceitt, ora disponibile in commercio, è in grado di riconoscere il parlato prodotto spontaneamente dopo una breve fase di addestramento in cui gli utenti registrano circa 400 brevi frasi. Il parlato riconosciuto può essere trascritto o letto da un sintetizzatore vocale per interagire con altre persone. Può inoltre essere impiegato per interagire con vari strumenti di intelligenza artificiale, come ChatGPT. «Per esempio, utilizzando la nostra app si potrebbe domandare “che tempo fa a Bruxelles?” oppure dire “aiutami a organizzare una festa di compleanno», osserva Smolley. Per raggiungere questo obiettivo, il team del progetto NUVOIC, guidato dall’impresa partner del consorzio Karten Network, ha raccolto vasti campioni di registrazioni della voce di persone con problemi di linguaggio. Questi set di dati sono stati combinati con tecniche di apprendimento automatico all’avanguardia per creare una soluzione di riconoscimento vocale unica nel suo genere.

Nuovi modi per connettersi

Oltre all’applicazione autonoma, il team ha realizzato anche un’interfaccia per programmi applicativi (API). Insieme a partner come imec, il gruppo ha lavorato su integrazioni che potrebbero migliorare ulteriormente l’indipendenza degli utenti e fornire loro nuovi modi per connettersi con gli altri. Un esempio è la collaborazione con Cisco per l’integrazione di Voiceitt con Webex. Il componente aggiuntivo permette agli utenti con capacità vocali non convenzionali di parlare in modo naturale durante una riunione, nonché di far trascrivere e visualizzare in tempo reale le proprie parole per gli altri partecipanti all’incontro. Il team di Voiceitt ha anche collaborato con il gigante dell’e-commerce Procter & Gamble per esplorare le possibilità di utilizzo della soluzione con finalità di acquisto vocale.

Un’ampia gamma di potenziali utenti

La tecnologia dispone del potenziale di aprire le porte a migliori interazioni vocali anche per altri utenti. «Abbiamo attirato molto interesse nell’applicazione della tecnologia agli accenti e ai dialetti», osserva Smolley. «Abbiamo anche condotto una prova pilota con un’azienda interessata a esplorare la tecnologia vocale per le persone sorde.» Come passo successivo, il team si sta preparando a espandere la propria offerta verso altre lingue europee. «In questo contesto, siamo attivamente alla ricerca di collaborazioni in tutta Europa, sia di partner che di partecipanti interessati a testare la tecnologia o a fornire campioni vocali», aggiunge Smolley.

Parole chiave

NUVOIC, riconoscimento vocale automatico, disturbi del linguaggio, disabilità vocali, assistente virtuale, interfaccia per programmi applicativi, API

Scopri altri articoli nello stesso settore di applicazione