European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

Cost-effective, Multilingual, Privacy-driven voice-enabled Services

Article Category

Article available in the following languages:

Dar voz a la privacidad de voz

El uso de tecnologías de interacción mediante la voz suscita nuevas preocupaciones sobre la privacidad y confidencialidad que requieren las soluciones y herramientas nuevas.

Economía digital icon Economía digital

La voz es la última moda. «Desde en nuestros teléfonos móviles hasta para cambiar de canal de televisión, cada vez utilizamos con más frecuencia la voz para interactuar con los dispositivos cotidianos», comenta Emmanuel Vincent, científico investigador experimentado y responsable del ámbito científico en el Instituto Nacional de Investigación sobre Ciencia y Tecnología Digitales (Inria) de Francia. Sin embargo, para que Alexa pueda responder a tu pregunta, primero debe recibir formación con una gran cantidad de datos de voz y texto. Para ello, las empresas tecnológicas suelen recopilar datos de voz de los usuarios y contratar a anotadores que los transcriben a texto. Entonces, los desarrolladores de aplicaciones definen una lista de posibles solicitudes de los usuarios y las respuestas correspondientes para cada aplicación. A continuación, el proceso se repite con cada idioma. Según Vincent, esto plantea toda una serie de problemas. «Ante todo, suscita preocupaciones fundamentales sobre la privacidad y la confidencialidad relacionadas con las características de la voz de los usuarios y el contenido hablado», explica. «Además, el proceso es costoso y, en consecuencia, no resulta inclusivo porque excluye numerosos idiomas y dialectos». Con el apoyo del proyecto COMPRISE, financiado con fondos europeos, el Inria lidera una iniciativa para definir un nuevo enfoque para la formación de las tecnologías de interacción por voz. «Aplicamos una nueva metodología y desarrollamos nuevas herramientas de "software" para crear soluciones que no solo protejan la privacidad y la confidencialidad, sino que también reduzcan los costes y mejoren la integración de esta tecnología en rápida expansión», añade Vincent, coordinador del proyecto.

Abordar el problema de la privacidad

Al inicio del proyecto, la anonimización de la voz era un concepto relativamente nuevo, por lo que no existían demasiados estudios sobre ella. «La mayoría de los enfoques para evaluar la anonimización se basaban en la asunción de que el atacante era ingenuo e intentaba reidentificar al orador mediante un programa informático de identificación biométrica diseñado para el discurso sin procesar», señala Vincent. «Pronto nos dimos cuenta de que esa asunción era errónea». Por consiguiente, los investigadores comenzaron por reescribir la historia. «Definimos un modelo de ataque más sólido en el que el atacante fuese consciente de la existencia del sistema de anonimización y adaptase el programa informático de identificación biométrica en consonancia», explica Vincent. A partir de ahí, el proyecto desarrolló unas herramientas de «software» innovadoras que han reducido el riesgo de reidentificación del orador varios órdenes de magnitud. Por encima de aumentar la privacidad, el proyecto creó también soluciones que mejoran la integración al permitir el desarrollo de sistemas de diálogo sin necesidad de disponer de recursos de formación en el idioma de destino. Además, elaboró un método que ha demostrado reducir el coste de integrar las funciones de voz en aplicaciones móviles en más de un 70 %. Ahora todas estas herramientas están disponibles para las empresas que producen tecnologías de voz y para los desarrolladores de aplicaciones en forma de código abierto a través del sitio web de COMPRISE.

Inclusión de la privacidad de voz en el RGPD

Además de la investigación avanzada y los progresos tecnológicos alcanzados por COMPRISE, el proyecto también mejoró la sensibilización sobre el creciente problema de la privacidad de voz. De hecho, Vincent ha sido invitado a hablar ante el organismo francés de protección de datos y ha contribuido a la consulta del Comité Europeo de Protección de Datos sobre asistentes de voz. «Sinceramente, espero que las directrices de aplicación del Reglamento General de Protección de Datos (RGPD) evolucionen para proteger mejor la privacidad y la confidencialidad, y permitir a las empresas europeas competir con los gigantes tecnológicos», concluye Vincent. Uno de esos negocios es Nijta. Esta nueva empresa emergente surgió a partir del proyecto COMPRISE y tiene por objetivo ofrecer las soluciones de anonimización de voz seguras que necesitan las empresas para establecer una relación de confianza con sus clientes.

Palabras clave

COMPRISE, privacidad de voz, tecnologías de interacción por voz, datos de voz, anonimización de la voz, protección de datos, RGPD

Descubra otros artículos del mismo campo de aplicación