Skip to main content

Multimodal context and voice recognition for seamless voice control technology interfaces with low upfront cost

Article Category

Article available in the folowing languages:

Il controllo vocale per l’intelligenza artificiale delle cose potrebbe annunciare un futuro più sicuro e più semplice

La pandemia di COVID-19 ha messo in evidenza i vantaggi offerti dal controllo senza contatto dei dispositivi. XMOS ha sviluppato un’interfaccia vocale per il settore emergente dell’intelligenza artificiale delle cose, consentendo di realizzare funzioni complesse con un costo contenuto a livello economico e ambientale.

Economia digitale

Le interfacce vocali offrono un modo più sicuro, meno complesso e più naturale di interagire con i dispositivi. Il progetto XMOS ha sviluppato un’interfaccia in grado di rilevare la presenza umana, di distinguere gli utenti l’uno dall’altro e di agire di conseguenza. «XMOS si avvale di un microcontrollore a bassissimo costo che esegue l’elaborazione vocale a livello locale, consumando solamente una piccola quantità di energia e di spazio fisico all’interno di un dispositivo. Inoltre, abbiamo aggiunto dei sensori per fornire informazioni locali di rilevamento delle persone che garantiscono il rispetto della privacy», spiega Mark Lippett, amministratore delegato di XMOS. Gli algoritmi sviluppati dal progetto sono stati integrati nel prodotto XVF3510, che è già attualmente utilizzato dai produttori, tra cui un operatore europeo, per un hub domotico «di prossima generazione».

Dai sensori alla rete neurale, fino all’applicazione

In seguito al rilascio del prodotto, gli utenti hanno richiesto la possibilità di personalizzare l’interfaccia vocale, soprattutto al fine di integrare essi stessi più «intelligenza» invece di dover fare affidamento su terze parti. Questo riscontro ha ispirato il progetto a creare una piattaforma di sviluppo economico per l’intelligenza artificiale delle cose (AIoT, artificial intelligence of things) chiamata xcore.ai. Mentre la piattaforma fornisce l’infrastruttura, un pacchetto di sviluppo per applicazioni (SDK, software development kit) consente agli sviluppatori di integrare intelligenza flessibile a elevate prestazioni nei propri prodotti. L’SDK è in grado di combinare segnali provenienti da più sensori, tra cui microfoni, telecamere o persino radar di piccole dimensioni, e impiega una rete neurale per rilevare caratteristiche chiave, come una parola o un volto specifici. Grazie all’utilizzo di una speciale unità di elaborazione vettoriale che di solito è presente esclusivamente all’interno di costosi processori grafici, XMOS ha aumentato l’efficienza di questo processo mantenendo al contempo bassi i costi. «Affinché i progettisti possano usare la nostra piattaforma in modo semplice, all’interno del nostro kit di strumenti forniamo interfacce per sensori e funzioni di pre-elaborazione. La rete neurale si avvale di un formato standard del settore, così da permettere agli utenti di creare rapidamente applicazioni utilizzando strumenti di cui sono già a conoscenza», afferma Tom Blackie, il responsabile del progetto XMOS. Nel corso del progetto, XMOS ha interagito con potenziali utenti al fine di testare diversi progetti e raccogliere riscontri. «La COVID ha influenzato i nostri test sui prototipi effettuati in laboratorio, per cui abbiamo creato un programma online di accesso immediato inviando dei “kit di esplorazione” a oltre 30 organizzazioni», osserva Blackie. «Grazie al collaudo degli utenti in ambienti reali abbiamo acquisito un riscontro rapido e concreto sul lavoro svolto.» Data l’importanza cruciale rivestita dalla privacy e dalla sicurezza, XMOS ha attuato varie tecniche, come ad esempio la cifratura del software impiegato dal dispositivo. I dati vengono inoltre trattati a livello locale, motivo per cui non è necessario affidarsi a servizi esterni basati sul cloud. È persino possibile operare in modo completamente indipendente da qualsiasi connessione di rete.

Per una vita migliore e più sicura

Oltre ai benefici relativi alla salute pubblica offerti dal controllo senza contatto, il progetto XMOS è riuscito a migliorare l’inclusività e la diversità, in quanto le interfacce vocali eliminano le aspettative implicite in termini di mobilità, agilità e competenze per svolgere le attività quotidiane. Il funzionamento a mani libere offre inoltre vantaggi durante l’impiego in ambienti rischiosi. Nelle cucine, ad esempio, la capacità del sistema di distinguere i diversi utenti potrebbe evitare che i bambini utilizzino elettrodomestici pericolosi, come i forni. Il ricorso a un’interfaccia vocale a basso consumo invece che a processori di applicazioni e servizi cloud più esigenti in termini di energia, inoltre, offre risparmi a livello energetico e riduce così la relativa impronta di carbonio. «Si prevede che il mercato dell’AIoT diventi un’industria da tremila miliardi di USD entro il 2024. Stiamo attualmente esplorando una vasta gamma di applicazioni nell’ambito di svariate industrie, tra cui opportunità di biomonitoraggio nel settore dell’assistenza sanitaria. Non vediamo l’ora di guidare l’evoluzione di uno degli sviluppi tecnologici più entusiasmanti dei nostri tempi», conclude Lippett.

Parole chiave

XMOS, intelligenza artificiale, intelligenza delle cose, senza contatto, COVID, a mani libere, vocale, interfaccia, salute pubblica, sensori, sicurezza

Scopri altri articoli nello stesso settore di applicazione