Skip to main content

Cost-effective, Multilingual, Privacy-driven voice-enabled Services

Article Category

Article available in the folowing languages:

Nagłośnienie kwestii prywatności głosu

Korzystanie z technologii interakcji głosowych wiąże się z nowymi wątpliwościami dotyczącymi prywatności i poufności, które wymagają nowych narzędzi i rozwiązań.

Gospodarka cyfrowa

Gdyby głos był kolorem, byłby teraz w modzie. „Od telefonów komórkowych po zmianę kanału w telewizji – coraz częściej korzystamy z głosu, by wchodzić w interakcje z codziennymi urządzeniami”, opowiada Emmanuel Vincent, starszy badacz oraz kierownik działu naukowego w Inria, francuskim Krajowym Instytucie na rzecz Badań nad Cyfrową Nauką i Technologią. Zanim Alexa odpowie na pytanie, trzeba ją najpierw przeszkolić, wykorzystując dużą ilość danych tekstowych oraz mowy. Aby to osiągnąć, firmy technologiczne pozyskują zwykle dame głosowe od użytkowników i zatrudniają ludzi, którzy transkrybują takie dane w tekst. Następnie twórcy aplikacji określają listę potencjalnych próśb użytkowników i powiązanych odpowiedzi dla każdej aplikacji. Cały proces powtarza się dla każdego języka. Według Vincenta, powoduje to szereg różnych problemów. „Przede wszystkim powstaje niezwykle ważny problem prywatności i poufności cech głosu użytkowników oraz wymawianych treści”, wyjaśnia. „Ponadto cały proces jest drogi, a przy tym z samej swej natury nie jest inkluzywny – wiele języków i dialektów jest pominiętych”. Przy wsparciu finansowanego ze środków Unii Europejskiej projektu COMPRISE Inria kieruje pracami mającymi na celu opracowanie nowego podejścia do szkolenia technologii interakcji głosowych. „Wdrażając nową metodologię i opracowując nowe oprogramowanie, stworzyliśmy rozwiązania, które nie tylko chronią prywatność i poufność, ale też ograniczają koszty i zwiększają inkluzywność tej błyskawicznie rozwijającej się technologii”, dodaje Vincent, koordynator projektu.

Rozwiązanie problemu prywatności

Kiedy rozpoczynano realizację projektu, anonimizacja głosu była dość nową koncepcją, co oznacza, że nie prowadzono nad nią zbyt wielu badań. „Większość podejść do oceny anonimizacji opierała się na założeniu, że atakujący jest naiwny i próbuje ponownie zidentyfikować osobę mówiącą, wykorzystując oprogramowanie do identyfikacji biometrycznej zaprojektowane do wyszukiwania bez przetwarzania”, zauważa Vincent. „Szybko zdaliśmy sobie sprawę z tego, że takie założenie jest błędne”. W związku z tym badacze zmienili swoje podejście. „Stworzyliśmy definicję modelu silniejszego ataku, w którym atakujący jest świadomy systemu anonimizacji i dostosowuje odpowiednio oprogramowanie do identyfikacji biometrycznej”, opowiada Vincent. Następnie twórcy projektu opracowali innowacyjne oprogramowanie, które zmniejszyło ryzyko ponownej identyfikacji osoby mówiącej o kilka rzędów wielkości. Oprócz zwiększenia prywatności badacze stworzyli także rozwiązania, które zwiększają inkluzywność poprzez umożliwienie rozwoju systemów dialogowych bez konieczności przeszkolenia zasobów z danego języka docelowego. Dodatkowo naukowcy stworzyli metodę, która – jak wykazano – ogranicza koszt włączania funkcji głosowych do aplikacji mobilnych o ponad 70 %. Wszystkie te narzędzia są obecnie dostępne dla firm produkujących technologie głosowe oraz dla twórców aplikacji jako oprogramowanie z otwartym kodem źródłowym na stronie internetowej COMPRISE.

Włączenie prywatności głosu do przepisów RODO

Oprócz przeprowadzenia zaawansowanych technologicznie badań i przyczynienia się do postępów technologicznych twórcy projektu COMPRISE pomogli również zwiększyć świadomość na temat coraz istotniejszej kwestii prywatności głosu. Vincent został nawet poproszony o wykład dla francuskiej agencji zajmującej się ochroną danych oraz pełnił rolę konsultanta Europejskiej Rady Ochrony Danych w odniesieniu do asystentów głosowych. „Naprawdę mam nadzieję, że wytyczne stosowania RODO zmienią się, aby lepiej chronić prywatność i poufność i umożliwić wszystkim europejskim firmom konkurowanie z gigantami z branży technologicznej”, podsumowuje Vincent. Jedną z tych firm jest Nijta. Ten nowy start-up powstał w trakcie realizacji projektu COMPRISE. Jego celem jest zaoferowanie bezpiecznych rozwiązań w zakresie anonimizacji głosu, których potrzebują firmy, aby budować z klientami relacje oparte na zaufaniu.

Słowa kluczowe

COMPRISE, prywatność głosu, technologie interakcji głosowych, dane głosowe, anonimizacja głosu, ochrona danych, RODO

Znajdź inne artykuły w tej samej dziedzinie zastosowania