Skip to main content
Weiter zur Homepage der Europäischen Kommission (öffnet in neuem Fenster)
Deutsch Deutsch
CORDIS - Forschungsergebnisse der EU
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Inhalt archiviert am 2024-05-18
Dynamic Universal Mobility for Adaptive Speech Interfaces

Article Category

Article available in the following languages:

Die Computer fangen an zu plaudern

Maschinen, die natürliche gesprochene Sprache verstehen und auf Anweisungen reagieren können, sind auf dem Weg eine alltägliche technische Erscheinung zu werden. Im Rahmen des europäischen DUMAS-Projekts wurde eine mehrsprachige, sprachbasierte Rahmentechnologie namens Athos entwickelt, die in einem modularen System verschiedene Computertechnologien nutzt.

Während fiktive Roboter wie R2D2 aus "Krieg der Sterne" immer nur mit Menschen zu kommunizieren scheinen, die sehr ähnliche Sprachen sprechen, müssen sich die in der Wirklichkeit existierenden Geräte, wie beispielsweise mobile Smart-Phones oder sprachgesteuerte Computersoftware, an unterschiedlichste Nutzer anpassen können. Letztere können in verschiedenen Sprachen oder Dialekten sprechen, in ihren Fähigkeiten variieren und ihre Geräte für verschiedenste Aufgaben nutzen. AthosMail ist ein beispielhafter Teil des Projekts. Dabei handelt es sich um eine mehrsprachige, sprachbasierte E-Mail-Anwendung, die sich an Sprecher derart verschiedener Sprachen wie Finnisch, Englisch oder Schwedisch anpassen kann. Seine Spracherkennungsschnittstelle lässt sich zum Lesen der meisten E-Mails einsetzen. AthosMail basiert auf der Open-Source-Anwendung Mailman und bietet darüber hinaus Komponenten aus folgenden Bereichen: Textverarbeitung, Dialogmanagement, Erstellung semantischer Vorlagen, Benutzermodellierung, integriertes Tutoring und Zufallsindexierung. Dabei verstehen die auf Athos basierenden Anwendungen nicht nur, was der Nutzer tun möchte, sie analysieren auch wie er reagiert, um daraus Rückschlüsse auf den Grad seiner/ihrer Kompetenz zu ziehen. In der Folge kann sich das Programm so daran anpassen, dass die Kommunikation "natürlich" wirkt. Auf der Grundlage der verschiedenen Erfahrungsebenen entscheidet die "Cooperativity Model" genannte Komponente, welches Sprachniveau für den Dialog mit dem Nutzer gewählt wird. Erhältlich ist die Anwendung, die modernste Computertechniken wie symbolische Berechnung und neuronale Netzwerke anwendet, in einer Online- und einer leicht abweichenden Offline-Version. Während die Offline-Version das Nutzerprofil lokal speichert und bei jedem Gebrauch der Anwendung dazulernt, fängt die Online-Variante bei jeder Sitzung wieder von vorn an.