La confiance dans les mots; de nouveaux services tournés vers la parole
La reconnaissance automatique de la parole (RAP) utilise la parole de l'utilisateur en guise d'entrée et produit une transcription, pouvant inclure des erreurs, de ce qui a été dit. Les applications réelles de la technologie de reconnaissance de la parole ont besoin de systèmes fiables pour parvenir à des résultats en permanence corrects dans différents environnements et pour différentes tâches. Les systèmes de reconnaissance de la parole actuels n'ont cependant pas encore été mis au point, de sorte que la procédure d'identification des erreurs dans le processus de reconnaissance de la parole reste primordiale. La reconnaissance d'un vocabulaire important de noms propres est particulièrement difficile. Les mesures de confiance sont une façon de gérer l'incertitude liée à la précision des résultats du système de reconnaissance de la parole. Les mesures de confiance acoustique sont dès lors essentielles pour de nombreux aspects de la reconnaissance de la parole, tels que le rejet des erreurs, la détection des mots en dehors du vocabulaire et la détermination des mots-clés. Le projet SMADA financé par l'UE a entrepris des recherches sur l'impact de deux causes d'erreurs différentes associées à la RAP: la confusion de noms et de mots de sonorité similaire et les problèmes dus à des bruits de fond ou une mauvaise articulation. Le projet a permis de découvrir que les mesures de confiance reposant sur une probabilité acoustique simple offraient les meilleurs résultats en corrigeant la confusion liée aux mots similaires d'un point de vue acoustique. Dans le cas des problèmes causés par le bruit ou une mauvaise articulation, les mesures de confiance doivent reposer sur un algorithme plus complexe. L'algorithme doit être capable de comparer la proportion de la masse de probabilité de l'hypothèse du «first best» aux hypothèses concurrentes. Le projet a conduit à la définition de mesures de confiance suffisamment fiables pour permettre au gestionnaire de dialogue d'un service d'assistance-annuaire automatisé de déterminer quelle tâche l'utilisateur essaie d'accomplir et comment résoudre les ambiguïtés. Il vérifie que, lorsqu'un système prend une décision, le taux d'erreur dans les mots est suffisamment bas. Ces mesures permettent de réduire le nombre d'échanges de dialogue et, ce faisant, la durée de l'interaction. Elles pourraient également limiter le pourcentage de propositions erronées faites par le service automatique. Les résultats de ce projet pourraient également être utilisés dans le cadre d'une formation et d'une adaptation non supervisées.