Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Inhalt archiviert am 2024-05-24
Speech Driven Multi-modal Automatic Directory Assistance

Article Category

Article available in the following languages:

Zuverlässige Worterkennung, neue sprachgesteuerte Dienste

Der erfolgreiche Einsatz der neuen sprachgesteuerten Directory Assistance (DA) Dienste und anderer Anwendungen ist abhängig von der Genauigkeit und Zuverlässigkeit der Erkennungsergebnisse. Die Ergebnisse von Zuverlässigkeitsmessungen spielen deshalb eine wichtige Rolle und sind notwendig für alle praktischen Anwendungen, bei denen die Entscheidung getroffen werden muss, ob ein erkanntes Wort angenommen oder zurückgewiesen werden soll.

Die automatische Spracherkennung (Automatic Speech Recognition - ASR) arbeitet mit dem sprachlichen Input des Nutzers und erstellt daraus eine Transkription des Gesagten, die ein gewisses Fehlerpotenzial aufweist. Gute Spracherkennungsanwendungen brauchen zuverlässige Systeme, die in verschiedenen Umgebungen und bei verschiedenen Aufgabenstellungen gleichbleibend korrekte Ergebnisse hervorbringen. Die aktuellen Spracherkennungssysteme sind jedoch noch lange nicht perfekt. Besonders die Identifizierung von Fehlern während der Spracherkennung bleibt von Bedeutung. Die Erkennung der zahlreichen Eigennamen bereitet dabei besonders große Schwierigkeiten. Zuverlässigkeitsmessungen sind eine Möglichkeit, die Unsicherheit in Bezug auf die Ergebnisgenauigkeit der Spracherkennungssysteme in den Griff zu bekommen. Akustische Zuverlässigkeitsmessungen erweisen sich daher für viele Aspekte der Spracherkennung als nützlich, z.B. für die Ablehnung falscher Wörter, zur Erkennung von Wörtern, die nicht im Vokabular enthalten sind, sowie zum Entdecken von Schlüsselwörtern. Das EU-Förderprojekt SMADA hat Untersuchungen zu den Auswirkungen zweier Fehlerursachen bei der automatischen Spracherkennung durchgeführt: Die Verwechslung von akustisch ähnlichen Namen und Wörtern sowie Probleme aufgrund von Hintergrundgeräuschen oder undeutlicher Aussprache. Das Projekt zeigte, dass Zuverlässigkeitsmessungen auf Grundlage einfacher akustischer Wahrscheinlichkeiten bei der Korrektur von Wortverwechslungen aufgrund akustischer Ähnlichkeiten die besten Ergebnisse bringen. Bei Problemen aufgrund von Geräuschen oder undeutlicher Aussprache müssen die Zuverlässigkeitsmessungen auf einen komplexeren Algorithmus zurückgreifen. Dieser Algorithmus sollte in der Lage sein, die Wahrscheinlichkeit der erstbesten Hypothese in Bezug zu alternativen Hypothesen zu setzen. Bei diesem Projekt entstanden Möglichkeiten zur Zuverlässigkeitsmessung, die eine genügende Verlässlichkeit gewährleisten. So kann der Dialogmanager eines automatischen Directory Assistance (DA) entscheiden, was der Nutzer erreichen möchte und wie die Zweideutigkeiten aufgelöst werden können. Dadurch kann sichergestellt werden, dass die Wort-Fehler-Quote (Word Error Rate - WER) bei allen Entscheidungen so niedrig ist, dass sie im akzeptablen Bereich liegt. Diese Messungen ermöglichen eine geringere Anzahl notwendiger Rückfragen und verkürzen so die Dauer der Interaktion. Außerdem kann dadurch der Anteil falscher Vorschläge durch den automatischen Sprachdienst reduziert werden. Die Ergebnisse dieses Projektes können auch für autonomes Lernen und Adaptionen eingesetzt werden.

Entdecken Sie Artikel in demselben Anwendungsbereich