European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Accessible Voice-Activated Technologies in a Voice-First World

Article Category

Article available in the following languages:

Asistentes de voz inclusivos, basados en la inteligencia artificial, para personas con trastornos del habla

¿Cómo podemos acercar la tecnología de asistencia por voz a quienes más la necesitan? El equipo del proyecto NUVOIC, financiado con fondos europeos, ha desarrollado un sistema de asistencia por voz —basado en la inteligencia artificial (IA)— destinado a ofrecer una mayor autonomía a las personas con discapacidades motoras y trastornos del habla.

Economía digital icon Economía digital

La tecnología de asistencia por voz está en auge. Según una encuesta elaborada en 2023, más de 8 de cada 10 directivos empresariales la emplean en su organización. Cada vez utilizamos más los sistemas de reconocimiento automático del habla (RAH) para interactuar con nuestros asistentes virtuales y equipos domóticos, buscar y comprar por Internet o transcribir el habla. Hasta la fecha, esta revolución no era nada integradora. «Por irónico que parezca, muchas de las personas que más necesitan estas tecnologías —por ejemplo, las personas con discapacidad, que necesitan ayuda para apagar las luces o encender el televisor— no pueden acceder a ellas porque también padecen trastornos del habla», señala Sara Smolley, vicepresidenta y cofundadora de la empresa emergente Voiceitt, cuya actividad gira en torno al RAH. Las personas con trastornos del habla forman una comunidad diversa que incluye, por ejemplo, pacientes con síndrome de Down y parálisis cerebral, pero también muchas personas ancianas. Gracias a la labor del proyecto NUVOIC, financiado con fondos europeos, Voiceitt permite ahora a muchos integrantes de este colectivo tan diverso interactuar y expresarse a través de nuevas vías. El término NUVOIC alude a la expresión inglesa «new voice» (nueva voz). El proyecto aspiraba a cumplir un doble objetivo, explica Smolley: «Por un lado, queríamos que las personas aquejadas de trastornos del habla pudieran expresarse con libertad y , al mismo tiempo, ofrecerles más independencia al poner en sus manos asistentes de voz basados en la inteligencia artificial».

Un avance tecnológico

La tecnología de primera generación empleada por Voiceitt ofrecía la posibilidad de entrenar una aplicación por medio de frases cotidianas que, más tarde, los usuarios podrían utilizar para expresarse. Gracias a la nueva financiación del proyecto en el marco de la iniciativa NUVOIC, el equipo de investigadores ha podido llevar esta idea un paso más lejos. La nueva aplicación en línea de Voiceitt, que ya se encuentra disponible comercialmente, es capaz de reconocer el habla producida de forma espontánea tras superar una breve fase de entrenamiento en la que los usuarios graban unas cuatrocientas frases cortas. Estos fragmentos de habla reconocidos pueden, luego, transcribirse o leerse mediante un sintetizador de voz, lo que permite al usuario dialogar con otras personas. También puede utilizarse para interactuar con herramientas propias de la IA, como ChatGPT. «Por ejemplo, alguien podría decir: “¿Qué tiempo hace en Bruselas?” o “Ayúdame a organizar una fiesta de cumpleaños” utilizando nuestra aplicación», señala Smolley. Para conseguirlo, el equipo del proyecto NUVOIC, dirigido por el socio del consorcio Karten Network, recopiló grandes muestras de grabaciones de voz procedentes de personas con trastornos del habla. Estos conjuntos de datos se combinaron con técnicas de aprendizaje automático de última generación con el fin de crear un sistema de reconocimiento del habla único.

Nuevas formas de conectarse

Además de la aplicación independiente, el equipo también desarrolló una interfaz de programación de aplicaciones. Con la ayuda de socios como el imec, el equipo trabajó en la creación de integraciones que contribuyeran a mejorar aún más la independencia de los usuarios y les ofrecieran nuevas formas de conectar con otras personas. Un buen ejemplo de ello es su colaboración con Cisco, que ha posibilitado integrar Voiceitt en Webex. Este complemento permite a los usuarios con trastornos de habla expresarse con naturalidad en el contexto de una reunión y lograr que sus palabras se transcriban y muestren al instante al resto de asistentes a la reunión. El equipo de Voiceitt también trabajó con el gigante del comercio electrónico, Procter & Gamble, para explorar cómo podría utilizarse Voiceitt de cara a una compra por voz.

Un amplio abanico de usuarios potenciales

Esta tecnología podría abrir la puerta a mejores interacciones vocales también para otros usuarios. «Tenemos mucho interés en llevar nuestra tecnología a otros acentos y dialectos», confiesa Smolley. «Asimismo, hemos realizado una prueba piloto en colaboración con una empresa interesada en explorar la tecnología de asistencia por voz para personas sordas». Como próxima meta, el equipo se dispone a ampliar su oferta a otras lenguas europeas. «En este sentido, nos encontramos en busca de nuevas colaboraciones por toda Europa: socios y participantes que estén interesados en probar nuestra tecnología o en remitirnos muestras de habla», añade Smolley.

Palabras clave

NUVOIC, reconocimiento automático del habla, RAH, trastornos del habla, asistente virtual, interfaz de programación de aplicaciones

Descubra otros artículos del mismo campo de aplicación