Skip to main content

Cost-effective, Multilingual, Privacy-driven voice-enabled Services

Article Category

Article available in the folowing languages:

Datenschutz für den Stimmaustausch

Der Einsatz von Sprachinteraktionstechnologien wirft neue Bedenken hinsichtlich des Datenschutzes und der Vertraulichkeit auf. Es besteht daher Bedarf an Instrumenten und Lösungen.

Digitale Wirtschaft

Wenn wir der Stimme eine Farbe zuordnen würden, wäre sie das neue Schwarz. „Von unseren Mobiltelefonen bis zum Wechsel des Fernsehkanals – wir benutzen zunehmend unsere Stimme, um mit Alltagsgeräten zu interagieren“, sagt Emmanuel Vincent, leitender Forscher und wissenschaftlicher Leiter beim französischen Nationalen Forschungsinstitut für Informatik und Automatisierung Inria. Bevor Alexa jedoch Ihre Frage beantworten kann, muss sie zunächst mittels einer großen Menge an Sprach- und Textdaten dahingehend „geschult“ werden. Zu diesem Zweck sammeln Technologieunternehmen in der Regel Sprachdaten von Nutzenden und beauftragen menschliche Arbeitskräfte damit, diese Daten zu annotieren und in Text zu transkribieren. In der Anwendungsentwicklung wird dann für jede Anwendung eine Liste möglicher Nutzungsanfragen und der dazugehörigen Antworten erstellt. Dieser Vorgang wird für jede Sprache wiederholt. Laut Vincent wirft dieses Verfahren eine ganze Reihe von Problemen auf. „In erster Linie weckt es substantielle Besorgnis hinsichtlich des Datenschutzes und der Vertraulichkeit in Bezug auf die Stimmmerkmale der Benutzerinnen und Benutzer sowie den Inhalt des Gesprochenen“, erklärt er. „Außerdem ist das Verfahren kostspielig und kann infolgedessen nicht umfassend sein, da viele Sprachen und Dialekte nicht berücksichtigt werden können.“ Mit Unterstützung des EU-finanzierten Projekts COMPRISE arbeitet Inria federführend an der Definition eines neuen Ansatzes für die Weiterentwicklung von Sprachinteraktionstechnologien. „Durch die Einführung einer neuen Methodik und die Entwicklung neuer Softwareinstrumente haben wir Lösungen geschaffen, die nicht nur die Privatsphäre und die Vertraulichkeit schützen, sondern auch die Kosten senken und die Annahmechancen für diese schnell wachsende Technologie erhöhen“, ergänzt Vincent, der als Projektkoordinator fungiert.

Das Problem des Datenschutzes angehen

Als das Projekt ins Leben gerufen wurde, war die Anonymisierung der Stimme ein relativ neues Konzept. Es wurde daher noch nicht viel in diese Richtung geforscht. „Die meisten Ansätze zur Bewertung der Anonymisierung basierten auf der Annahme, dass der Angreifer naiv ist und versucht, den Sprecher oder die Sprecherin mithilfe biometrischer Identifizierungssoftware, die für unverarbeitete Sprache entwickelt wurde, zu re-identifizieren“, merkt Vincent an. „Wir erkannten jedoch schnell, dass diese Annahme falsch ist.“ Also gingen die Forschenden die Sache mit einer anderen Strategie an. „Wir definierten ein stärkeres Angriffsmodell, bei dem die angreifende Person das Anonymisierungssystem kennt und die biometrische Erkennungssoftware daran anpasst“, erläutert Vincent. Auf dieser Grundlage entwickelte das Projektteam innovative Softwareinstrumente, die das Risiko einer erneuten Identifizierung der sprechenden Person um mehrere Größenordnungen verringerten. Neben der Stärkung des Datenschutzes wurden im Rahmen des Projekts auch Lösungen für die Verbesserung der Integration von Menschen geschaffen, indem bei der Entwicklung von Dialogsystemen nicht auf Schulungsressourcen in der Zielsprache zurückgegriffen werden muss. Darüber hinaus wurde eine Methode entwickelt, mit der die Kosten für die Einbindung von Sprachfunktionen in mobile Anwendungen nachweislich um mehr als 70 % gesenkt werden. All diese Werkzeuge stehen nun Sprachtechnologieunternehmen und der Anwendungsentwicklung als offener Quellcode über die COMPRISE-Website zur Verfügung.

Aufnahme des Datenschutzes für Stimmen in die DSGVO

Zusätzlich zu der Spitzenforschung und den technologischen Fortschritten, die durch COMPRISE erzielt wurden, hat das Projekt auch dazu beigetragen, das Bewusstsein für das wachsende Problem des Datenschutzes bei der Sprachkommunikation zu schärfen. So wurde Vincent tatsächlich dazu eingeladen, vor der französischen Datenschutzbehörde zu sprechen, und leistete damit einen Beitrag zur Konsultation des Europäischen Datenschutzausschusses zum Thema Sprachassistenz. „Ich hoffe aufrichtig, dass die Anwendungsrichtlinien der Datenschutz-Grundverordnung weiterentwickelt werden, damit die Privatsphäre und die Vertraulichkeit besser geschützt wird und europäische Unternehmen mit Tech-Giganten konkurrieren können“, so Vincent abschließend. Eines dieser Unternehmen ist Nijta. Das neue Start-up-Unternehmen ist eine Ausgründung des Projekts COMPRISE und hat sich zum Ziel gesetzt, sichere Lösungen für die Anonymisierung der Stimme anzubieten, die Unternehmen für den Aufbau vertrauensvoller Beziehungen zu ihrer Kundschaft benötigen.

Schlüsselbegriffe

COMPRISE, Sprachdatenschutz, Sprachinteraktionstechnologien, Sprachdaten, Anonymisierung der Stimme, Datenschutz, Datenschutz-Grundverordnung, DSGVO

Entdecken Sie Artikel in demselben Anwendungsbereich

Wissenschaftliche Fortschritte
Digitale Wirtschaft
Verkehr und Mobilität

21 Dezember 2021