Skip to main content

Multimodal context and voice recognition for seamless voice control technology interfaces with low upfront cost

Article Category

Article available in the folowing languages:

Sprachsteuerung für die künstliche Intelligenz der Dinge für eine sicherere, einfachere Zukunft

Die COVID-19-Pandemie hat gezeigt, dass eine kontaktlose Gerätesteuerung von Vorteil ist. XMOS hat eine Sprachschnittstelle für das aufstrebende Gebiet der künstlichen Intelligenz der Dinge entwickelt, die komplexe Funktionen zu geringen finanziellen und ökologischen Kosten bietet.

Digitale Wirtschaft

Sprachschnittstellen sind eine einfachere, sicherere und natürlichere Möglichkeit, mit Geräten zu interagieren. Das Projekt XMOS hat eine Schnittstelle entwickelt, welche die Präsenz von Menschen erkennen, Nutzerinnen und Nutzer voneinander unterscheiden und entsprechend agieren kann. „XMOS nutzt einen äußerst kostengünstigen Mikrocontroller, der Sprache lokal verarbeitet, wobei nur wenig Strom verbraucht und im Gerät kaum Platz in Anspruch genommen wird. Außerdem haben wir Sensoren hinzugefügt, damit lokale, datenschutzsensible Information zur Erkennung von Personen bereitgestellt werden können“, erklärt Mark Lippett, Geschäftsführer von XMOS. Die im Rahmen des Projekts entwickelten Algorithmen wurden in das XVF3510-Produkt eingebunden, das bereits von Herstellern genutzt wird, unter anderem von einem europäischen Betreiber eines Smart Home Hubs der „nächsten Generation“.

Von Sensoren über neuronale Netzwerke bis hin zu Anwendungen

Nachdem das Produkt auf dem Markt eingeführt wurde, baten die Nutzerinnen und Nutzer um eine Personalisierungsmöglichkeit der Sprachschnittstelle – vor allem, damit sie selbst mehr „Intelligenz“ einbringen können, anstatt sich auf Dritte zu verlassen. Inspiriert von diesen Rückmeldungen, entschied sich das Projektteam, eine kostengünstige Entwicklungsplattform für die künstliche Intelligenz der Dinge (AIoT) zu schaffen, die den Namen xcore.ai trägt. Während die Plattform für die Infrastruktur sorgt, können Entwicklerinnen und Entwickler ihre Produkte dank eines Software Development Kits (SDK) mit einer leistungsfähigen, flexiblen Intelligenz versehen. Das SDK kann Signale von verschiedenen Sensoren, wie Mikrofonen, Kameras oder sogar kleinen Radaren kombinieren und erkennt anhand eines neuronalen Netzwerks entscheidende Merkmale, wie ein bestimmtes Wort oder Gesicht. Durch eine spezielle Vektorverarbeitungseinheit, die normalerweise nur in teuren Grafikprozessoren zu finden ist, konnte XMOS die Effizienz des Prozesses steigern und die Kosten gleichzeitig niedrig halten. „Damit Entwicklerinnen und Entwickler unsere Plattform leichter nutzen können, umfasst unser Instrumentarium Sensorschnittstellen und Vorverarbeitungsfunktionen. Das neuronale Netzwerk bedient sich eines branchenüblichen Formats, damit Nutzerinnen und Nutzer Anwendungen schnell mit den Instrumenten entwickeln können, die sie bereits kennen“, sagt Tom Blackie, Projektleiter von XMOS. Über das gesamte Projekt hinweg hat XMOS potenzielle Nutzende einbezogen, um Designs zu testen und Feedback einzuholen. „COVID hat sich auf unseren Prototypentest im Labor ausgewirkt, weshalb wir ein Online-Frühversionsprogramm erstellt haben, bei dem die ‚Explorer Kits‘ an mehr als 30 Unternehmen gesendet wurden“, so Blackie. „Dadurch, dass die Nutzertests in realen Umgebungen stattfanden, erhielten wir schnell ein konkretes Feedback zu unserer Arbeit.“ Da der Datenschutz und die Sicherheit oberste Priorität haben, hat XMOS verschiedene Techniken eingebunden, wie die Verschlüsselung der Gerätesoftware. Darüber hinaus werden die Daten lokal verarbeitet, wodurch keine externen, cloudbasierten Dienste benötigt werden. Das System lässt sich sogar ganz ohne Netzwerkverbindung bedienen.

Für ein besseres und sichereres Leben

Abgesehen von den Vorteilen der kontaktlosen Steuerung für die öffentliche Gesundheit, könnte das XMOS-Projekt die Inklusion und Diversität verbessern, da Sprachschnittstellen implizite Vorstellungen von der Mobilität, Agilität und Lese- und Schreibfähigkeit bei alltäglichen Aufgaben beseitigen. Ferner bietet die freihändige Bedienung Vorteile in gefährlichen Umgebungen. Da das System zwischen Personen unterscheiden kann, könnte es beispielsweise in der Küche verhindern, dass Kinder gefährliche Geräte wie den Herd bedienen. Durch die Nutzung einer stromsparenden Schnittstelle anstelle von energieintensiveren Anwendungsprozessoren und Clouddiensten lassen sich außerdem Strom sparen und dadurch der CO2-Fußabdruck reduzieren. „Der Markt für die künstliche Intelligenz der Dinge soll bis 2024 3 Billionen USD wert sein. Derzeit untersuchen wir zahlreiche Anwendungen in einer Vielzahl von Brachen, darunter Biomonitoring-Möglichkeiten für das Gesundheitswesen. Wir freuen uns darauf, eine der spannendsten technologischen Entwicklungen unserer Zeit voranzutreiben“, unterstreicht Lippett.

Schlüsselbegriffe

XMOS, künstliche Intelligenz, künstliche Intelligenz der Dinge, kontaktlos, COVID, freihändig, Sprache, Schnittstelle, öffentliche Gesundheit, Sensoren, Sicherheit

Entdecken Sie Artikel in demselben Anwendungsbereich