Lernen Sie den Roboter kennen, der spricht wie wir
Menschlich aussehende Roboter werden in unserem Leben immer alltäglicher werden. Es ist daher verständlich, dass die Wissenschaft sie so menschlich wie möglich gestalten möchte. Und wenn sie wie wir aussehen, warum sollten sie dann nicht auch wie wir sprechen? Ein Wissenschaftsteam unter der Leitung der Columbia University in den Vereinigten Staaten hat einen Roboter namens Emo(öffnet in neuem Fenster) entwickelt, der lernen kann, seine Lippen zum Sprechen und Singen zu bewegen. Die Ergebnisse wurden in der Fachzeitschrift „Science Robotics“(öffnet in neuem Fenster) veröffentlicht.
Lippensynchronisation zu Sprache und Gesang erlernen
Zunächst wurde Emo von ihnen derart konzipiert, dass er vor einem Spiegel übt und mit seinen 26 Gesichtsmuskeln experimentiert, damit er lernt, wie sich sein eigenes Gesicht bewegt. Dann sah er sich stundenlang YouTube-Videos an, um zu beobachten, wie sich menschliche Münder beim Sprechen und Singen bewegen. Das aus Silikonhaut bestehende Gesicht kann Lippenformen bilden, die 24 Konsonanten und 16 Vokale abdecken. „Je mehr er mit Menschen interagiert, desto besser wird er“, kommentierte Hod Lipson, Professor für Ingenieurwissenschaften, in einer Pressemitteilung(öffnet in neuem Fenster). „Wird die Fähigkeit zur Lippensynchronisation mit konversationsfähiger KI wie ChatGPT oder Gemini kombiniert, verleiht der Effekt der Verbindung, die Roboter und Menschen eingehen, eine ganz neue Tiefe“, erklärte Yuhang Hu, Forscher am Creative Machines Lab, wo die Arbeit durchgeführt wurde. „Je mehr der Roboter Menschen bei Gesprächen beobachtet, desto besser kann er die nuancierte Mimik nachahmen, mit der wir emotionale Verbindungen herstellen können.“
Fehlendes Teil der Robotik?
„Bei einem Großteil der humanoiden Robotik stehen heute die Bewegung von Beinen und Händen für Aktivitäten wie Gehen und Greifen im Mittelpunkt“, erläuterte Lipson. „Aber auch bei jeder Roboteranwendung, die mit menschlicher Interaktion zu tun hat, ist die Mimik gleichermaßen von Bedeutung.“ Er fügte hinzu: „Es gibt keine Zukunft, in der all diese humanoiden Roboter kein Gesicht besitzen. Und wenn sie endlich ein Gesicht haben, müssen sie ihre Augen und Lippen richtig bewegen, ansonsten bleiben sie uns für immer unheimlich.“ Lipson ist begeistert von der Aussicht, dass sich ein Roboter natürlicher anfühlen könnte. „Lernt ein Roboter lächeln oder sprechen, indem er Menschen beobachtet und ihnen zuhört, dann geschieht etwas Magisches. Ich bin ein erfahrender Robotiker, aber ich kann nicht anders, als zurückzulächeln, wenn mich ein Roboter spontan anlächelt.“ Das menschliche Gesicht ist das stärkste Kommunikationsmittel. Bei fortgeschrittenen humanoiden Maschinen wird dieser Bereich noch wichtiger werden. „Roboter mit dieser Fähigkeit werden eindeutig besser in der Lage sein, mit Menschen in Kontakt zu treten, da ein Großteil unserer Kommunikation über Gesichtsausdruck und Körpersprache erfolgt, und dieser gesamte Kanal ist noch nicht erschlossen“, stellte Hu fest. Lipson ist sich jedoch der Risiken und potenziellen Kontroversen bei der Entwicklung von Robotern bewusst, die natürlicher sind und emotionale Reaktionen auslösen. „Das wird eine wirkmächtige Technologie sein. Wir müssen langsam und vorsichtig vorgehen, damit wir die Vorteile nutzen und gleichzeitig die Risiken minimieren können.“ Früher oder später werden humanoide Roboter auf eine Weise sprechen – und singen –, die völlig natürlich erscheint. Nur hoffentlich werden wir es dann nie verwechseln, dass wir mit einem Roboter kommunizieren und nicht mit einer echten Person.