Skip to main content
CORDIS - Forschungsergebnisse der EU
CORDIS

Disrupting the Communication between Humans and Computers - Understanding the Key Message in Simultaneous Conversations Through Voice Biometrics

Article Category

Article available in the following languages:

Neue Software für virtuellen Assistenten soll geschäftliche Besprechungen transformieren

Im Rahmen eines EU-finanzierten Projekts wurde eine Software für einen virtuellen Assistenten entwickelt, die eine konstruktive Beteiligung bei geschäftlichen Besprechungen fördern und Störungen reduzieren kann. Sie übernimmt Routineaufgaben wie das Transkribieren von Gesprächen, das Mitschreiben und sogar das Einpflegen von Aufgaben in den Kalender des Projektmanagements.

Digitale Wirtschaft icon Digitale Wirtschaft
Gesellschaft icon Gesellschaft

Die Nutzung von virtuellen Assistenten am Arbeitsplatz nimmt zu. Schätzungen des Marktforschungsunternehmens Gartner zufolge werden bis 2021 voraussichtlich 25 % aller Arbeitskräfte täglich auf virtuelle Assistenten zurückgreifen. Die Technologie kann Unternehmen jeder Größe – vom Start-up über kleine und mittlere Unternehmen bis hin zu größeren Firmen – repetitive und zeitraubende Aufgaben in Besprechungen abnehmen.

Der Kommunikation zwischen Mensch und Maschine zur nächsten Stufe verhelfen

Intelligente virtuelle Assistenten beruhen auf der Verarbeitung natürlicher Sprache, einer Form der künstlichen Intelligenz, mit deren Hilfe Computer die menschliche Sprache verstehen sollen. „Wir wollen die Interaktion zwischen Menschen und Maschinen revolutionieren, sodass die Kommunikation natürlicher und fließender wird“, merkt Marta Casar, Ingenieurin bei Verbio und Koordinatorin des EU-finanzierten Projekts PAY-ME-ATTENTION, an. „Verbios Software für einen virtuellen Assistenten ist eines der modernsten Systeme auf dem Markt. Es bietet eine kontinuierliche Sprachverarbeitung und nahezu fehlerfreie Echtzeit-Transkription.“ Während andere Systeme oftmals an realen Umgebungen scheitern, kann das System von Verbio den natürlichen Gesprächsfluss sofort interpretieren und die Daten der Nutzerinnen und Nutzer von Hintergrundgeräuschen und Musik unterscheiden. „Auf Grundlage der jüngsten Fortschritte im Bereich künstliche Intelligenz haben wir innovative Algorithmen kreiert, die bei der Entwicklung einer stabilen Spracherkennung helfen können. Wir sind überzeugt, dass unsere Algorithmen alle Systeme für virtuelle Assistenten oder Spracherkennung auf der Welt versorgen können, wodurch sie genauer und weniger anfällig für Sicherheitsbedrohungen werden“, so Casar weiter.

Modernste Softwaremodule

Verbios Software setzt sich aus mehreren Modulen zusammen, die entweder zusammenarbeiten oder als einzelne Module in die Spracherkennungssoftware integriert werden können. Die Spracheingabe wird über eine kreisförmige Anordnung von sechs Mikrofonen registriert, welche die Audioübertragung an einen Speicherserver sendet. Ein Sprachverbesserungsmodul steigert die Sprachqualität durch verschiedene Techniken: die Einfallsrichtung, das Beamforming, die Echo- und Rauschunterdrückung sowie die automatische Verstärkungsregelung. Zur Verbesserung der Sprachverarbeitung nutzt das System zwei weitere Module, von denen eines das Vorhandensein oder Fehlen menschlicher Sprache erkennt. Bei dem anderen handelt es sich um ein Modul zur blinden Quellentrennung, das die Quellsignale von den Mischsignalen aus den sechs Mikrofonen trennt. Währenddessen teilt das System für die Sprecherdiarisierung die eingehende Sprachübertragung in Segmente auf und gruppiert sie anhand der Identität der Sprecherin bzw. des Sprechers. Die Ausgabe dieses Moduls wird über ein Sprachbiometriesystem verarbeitet, das die Identität der Sprechenden verifiziert. Dabei werden die einzelnen diarisierten Segmente den jeweiligen Sprecherinnen und Sprechern zugeordnet. Die Gesprächstranskription erfolgt über ein kontinuierliches Spracherkennungssystem. Außerdem wendet die Software von Verbio ein Verfahren zur Verarbeitung natürlicher Sprache an, das die Bedeutung aus den transkribierten Texten über das Erkennen von wiederkehrenden Themen automatisch extrahiert. „Unsere Technik zur Themenklassifikation gibt einen unmittelbaren Überblick über alle Themen, die in der Besprechung diskutiert wurden. Darüber hinaus haben wir ein Verfahren entwickelt, mit dem die Themen nach Priorität geordnet werden: Je mehr Wörter einem Thema zugeordnet werden, desto höher die Priorität“, erklärt Casar. Schließlich kodiert und gruppiert das Zusammenfassungsmodul Sätze mit ähnlicher Bedeutung und gibt so einen kürzeren Text wieder. Virtuelle Assistenten in Konferenzräumen werden der nächste große Trend am Arbeitsplatz sein. „Unser integriertes System kann in Besprechungsräumen jeglicher Art eingesetzt werden. In naher Zukunft könnten virtuelle Assistenten auch die Produktivität in Videokonferenzen verbessern und nicht nur das: Sie könnten sie sogar leiten“, so Casar abschließend.

Schlüsselbegriffe

PAY-ME-ATTENTION, virtueller Assistent, Verbio, Verarbeitung natürlicher Sprache, geschäftliche Besprechung, künstliche Intelligenz, Gesprächstranskription, Sprecherdiarisierung

Entdecken Sie Artikel in demselben Anwendungsbereich