Skip to main content

Cost-effective, Multilingual, Privacy-driven voice-enabled Services

Article Category

Article available in the folowing languages:

Donner une voix à la confidentialité des conversations

L’utilisation des technologies d’interaction vocale soulève de nouvelles inquiétudes en matière de vie privée et de confidentialité qui nécessitent de nouveaux outils et de nouvelles solutions.

Économie numérique

Les applications vocales sont devenues la dernière tendance. «De nos téléphones portables au changement de chaîne télévisée, nous utilisons de plus en plus nos voix pour interagir avec des appareils du quotidien», explique Emmanuel Vincent, chercheur scientifique principal et directeur du département des sciences à l’Inria, l’Institut national de recherche en sciences et technologies du numérique de France. Toutefois, avant qu’Alexa ne puisse répondre à votre question, elle doit d’abord être formée sur une grande quantité de discours et de données textuelles. Pour ce faire, les entreprises technologiques recueillent généralement des données vocales auprès des utilisateurs et engagent des annotateurs humains pour les transcrire en texte. Les développeurs d’applications définissent ensuite une liste de demandes éventuelles d’utilisateurs et leurs réponses correspondantes pour chaque application. Ce processus est alors répété pour chaque langue. Selon Emmanuel Vincent, il soulève de nombreux problèmes. «Avant tout, il suscite de sérieuses inquiétudes en matière de vie privée et de confidentialité liées aux caractéristiques vocales et au contenu parlé des utilisateurs», poursuit-il. «En outre, le processus est onéreux, et il en résulte qu’il n’est pas intrinsèquement inclusif étant donné que de nombreuses langues et de nombreux dialectes sont omis.» Grâce au soutien du projet COMPRISE, financé par l’UE, l’Inria tente de définir une nouvelle approche de la formation des technologies d’interaction vocale. «En mettant en œuvre une nouvelle méthodologie et en développant de nouveaux outils logiciels, nous avons créé des solutions qui protègent non seulement la vie privée et la confidentialité, mais qui réduisent aussi les coûts et améliorent l’inclusivité de cette technologie à croissance rapide», ajoute Emmanuel Vincent, le coordinateur du projet.

Aborder le problème de la vie privée

Lorsque le projet a débuté, l’anonymisation vocale était un concept relativement neuf, en d’autres termes, peu de recherches avaient été réalisées à ce sujet. «La plupart des approches visant à évaluer l’anonymisation reposaient sur l’hypothèse qu’un agresseur était naïf et tentait de réidentifier l’orateur en utilisant un logiciel d’identification biométrique conçu pour le discours non traité», souligne Emmanuel Vincent. «Nous avons rapidement réalisé que cette hypothèse était incorrecte.» Pour commencer, les chercheurs ont donc dû réécrire l’histoire. «Nous avons défini un modèle d’attaque plus fort dans lequel l’agresseur connait le système d’anonymisation et adapte le logiciel d’identification biométrique en conséquence», poursuit Emmanuel Vincent. De là, le projet a mis au point des outils logiciels innovants qui ont réduit le risque de réidentification de l’orateur de plusieurs ordres de grandeur. En plus de renforcer la vie privée, le projet a également créé des solutions qui améliorent l’inclusivité en facilitant le développement de systèmes de dialogue sans devoir recourir à des ressources de formation dans la langue cible. En outre, le projet a élaboré une méthode qui permet de réduire le coût de l’intégration des caractéristiques vocales dans les applications mobiles de plus de 70 %. Tous ces outils sont désormais disponibles pour les entreprises de technologies vocales et les développeurs d’applications en tant que source ouverte via le site web de COMPRISE.

Intégrer la confidentialité des conversations dans le RGPD

En plus de la recherche de pointe et des avancées technologiques réalisées par COMPRISE, le projet a également permis de sensibiliser au problème croissant de la confidentialité des conversations. Emmanuel Vincent a ainsi été invité à s’exprimer à l’agence française de protection des données et a contribué à la consultation du Comité européen de la protection des données sur les assistants vocaux. «J’espère sincèrement que les directives relatives à l’application du RGPD évolueront afin de mieux protéger la vie privée et la confidentialité, et qu’elles permettront aux entreprises européennes de rivaliser avec les grandes entreprises technologiques», conclut Emmanuel Vincent. L’une de ces entreprises est Nijta. Cette nouvelle start-up est une spin-off du projet COMPRISE qui entend proposer des solutions sûres d’anonymisation vocale dont les entreprises ont besoin pour bâtir des relations de confiance avec leurs clients.

Mots‑clés

COMPRISE, confidentialité des conversations, technologies d’interaction vocale, données vocales, anonymisation vocale, protection des données, RGPD

Découvrir d’autres articles du même domaine d’application

Progrès scientifiques
Économie numérique
Transports et Mobilité

21 Decembre 2021