Skip to main content
European Commission logo
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Contenu archivé le 2024-05-18

Dynamic Universal Mobility for Adaptive Speech Interfaces

Article Category

Article available in the following languages:

Des ordinateurs prêts pour de petites conversations

Les machines capables de comprendre le langage parlé naturel et de répondre à des ordres sont destinés à faire partie intégrante des technologies de tous les jours. Le projet européen DUMAS a mis au point un cadre de développement multilingue à commande vocale appelé Athos, qui utilise des technologies informatiques hybrides dans un système modulaire.

Si les robots de fiction tels que le R2D2 de Star Wars sont représentés en pleine interaction avec des êtres humains qui semblent parler des langues relativement similaires, les dispositifs du monde réel tels que les téléphones mobiles intelligents ou les logiciels informatiques à commande vocale doivent s'adapter à de nombreux utilisateurs différents, lesquels peuvent parler des langues et des dialectes différents, avoir des niveaux de compétence divers et demander à leur installation d'exécuter diverses tâches à leur place. Un des exemples de systèmes issus du projet est AthosMail, une application de messagerie électronique multilingue à commande vocale capable de s'adapter à ces divers utilisateurs, et notamment des interlocuteurs finlandais, anglais et suédois. Son interface de reconnaissance vocale peut être utilisée pour la plupart des tâches de lecture d'e-mail. En outre, AthosMail, qui repose sur l'application ouverte Mailman, propose des composantes pour le traitement de texte, la gestion des dialogues, l'élaboration de modèles sémantiques, la modélisation des utilisateurs, le tutorat intégré et l'indexation aléatoire. Les applications reposant sur Athos comprennent non seulement l'action que veut exécuter un utilisateur, mais sont en outre capables d'analyser la réponse d'un utilisateur et de tirer des conclusions sur son niveau de compétence. Le système peut alors adapter son comportement en conséquence afin de maintenir un sentiment «naturel» d'interaction. La composante «modèle de coopérativité» décide du niveau de langage à utiliser pour dialoguer avec l'utilisateur après avoir observé son niveau d'expérience. L'application, qui utilise des méthodes de calcul modernes comme le calcul symbolique et les réseaux neuronaux, est disponible dans des versions en ligne et hors ligne, qui présentent de légères différences. La version hors ligne enregistre le profil d'un utilisateur au niveau local et continue de recueillir des informations à son sujet chaque fois qu'il utilise l'application, tandis que la version en ligne recommence à zéro à chaque nouvelle session.