Skip to main content

Disrupting the Communication between Humans and Computers - Understanding the Key Message in Simultaneous Conversations Through Voice Biometrics

Article Category

Article available in the folowing languages:

Nowy asystent wirtualny zmieni oblicze spotkań biznesowych

W ramach finansowanego przez Unię Europejską projektu powstał wirtualny asystent, który może sprzyjać konstruktywnemu zaangażowaniu w czasie spotkań biznesowych i zmniejszać liczbę czynników rozpraszających uwagę uczestników. Dzięki nowemu rozwiązaniu uczestnicy spotkań nie muszą już zajmować się takimi kwestiami jak transkrypcja rozmów, przygotowywanie notatek oraz dodawanie zadań do kalendarza zarządzania projektami.

Gospodarka cyfrowa
Społeczeństwo

Jesteśmy obecnie świadkami stale rosnącej popularności wirtualnych asystentów w środowiskach biznesowych. Jak wynika z badań przeprowadzonych przez firmę badawczą Gartner, do 2021 roku nawet 25 % pracowników firm będzie codziennie korzystać z usług wirtualnych asystentów. Technologia ta może przynieść korzyści wielu firmom, niezależnie od ich wielkości – zarówno start-upom, jak i małym i średnim przedsiębiorstwom czy dużym korporacjom. Jednym z jej zastosowań może być wykonywanie powtarzalnych i czasochłonnych czynności w czasie spotkań.

Nowy, wyższy poziom komunikacji człowiek-maszyna

Działanie inteligentnych wirtualnych asystentów opiera się na technologii przetwarzania języka naturalnego, będącej jedną z form sztucznej inteligencji. Jej celem jest umożliwienie komputerom rozumienia ludzkiego języka. „Naszym głównym celem jest zrewolucjonizowanie interakcji pomiędzy ludźmi i maszynami, aby zapewnić bardziej naturalną i ciągłą komunikację pomiędzy nimi”, mówi Marta Casar, inżynierka w firmie Verbio oraz koordynatorka finansowanego przez Unię Europejską projektu PAY-ME-ATTENTION. „Asystent wirtualny opracowany przez firmę Verbio jest jednym z najbardziej zaawansowanych systemów w swojej klasie spośród rozwiązań dostępnych obecnie na rynku, umożliwiającym przetwarzanie głosu w trybie ciągłym i prowadzenie niemal bezbłędnych transkrypcji w czasie rzeczywistym”. W odróżnieniu od wielu innych systemów, które często zawodzą w rzeczywistych warunkach, system stworzony przez firmę Verbio potrafi niemal natychmiastowo interpretować naturalny przebieg rozmowy i rozróżniać użyteczne dane od hałasów i muzyki w tle. „Dzięki najnowszym osiągnięciom w dziedzinie sztucznej inteligencji, udało nam się opracować innowacyjne algorytmy, na których zamierzamy oprzeć nasze niezawodne rozwiązanie do rozpoznawania mowy. Jesteśmy głęboko przekonani, że nasze algorytmy już wkrótce będą stanowiły podstawę wszystkich wirtualnych asystentów i systemów rozpoznawania mowy na całym świecie, przyczyniając się do zwiększenia ich dokładności oraz odporności na zagrożenia bezpieczeństwa”, dodaje Casar.

Nowoczesne oprogramowanie

Oprogramowanie wirtualnego asystenta opracowane przez firmę Verbio składa się z szeregu modułów, które mogą zostać połączone lub zintegrowane z oprogramowaniem rozpoznającym głos i mowę w formie pojedynczych modułów. Głosy użytkowników są rejestrowane przez sześć mikrofonów ułożonych w okręgu, przesyłających strumień audio do serwera. Działający na serwerze moduł poprawiający jakość głosu przetwarza nagrania przy pomocy różnych technik, obejmujących wykrywanie kierunku, z którego dochodzi głos, kształtowanie wiązki, usuwanie echa i szumów, a także automatyczną regulację wzmocnienia. Ponadto system wykorzystuje dwa inne moduły w celu usprawnienia przetwarzania mowy – jeden z nich odpowiada za wykrywanie ludzkiego głosu w nagraniu, natomiast drugi zajmuje się rozdzielaniem sygnałów źródłowych z zestawu sygnałów pochodzących z sześciu mikrofonów. Jednocześnie działa także system rozpoznawania mówcy, który rozdziela strumień dźwięku na mniejsze segmenty i grupuje je na podstawie tożsamości osoby mówiącej. Dane wyjściowe dostarczane przez ten moduł są następnie przetwarzane przez system biometryki głosu, który weryfikuje tożsamość osób mówiących i przypisuje każdy z rozdzielonych uprzednio segmentów odpowiedniej osobie. System rozpoznawania mowy transkrybuje jednocześnie treść rozmowy. Oprogramowanie opracowane przez firmę Verbio wykorzystuje również technikę przetwarzania języka naturalnego, która pozwala na automatyczne wyodrębnianie znaczeń z transkrybowanych tekstów dzięki identyfikacji powtarzających się tematów. „Nasza technika klasyfikacji tematów pozwala na natychmiastowy przegląd wszystkich tematów poruszanych w czasie spotkania. Opracowaliśmy także technikę sortowania tematów na podstawie priorytetów – im większa jest liczba słów przypisanych do danego tematu, tym wyższy jest jego priorytet”, wyjaśnia Casar. Obróbka kończy się na module podsumowującym, który koduje i zbiera zdania o podobnym znaczeniu, skracając w ten sposób tekst docelowy. Wirtualni asystenci w salach konferencyjnych zmienią oblicze miejsc pracy. „Nasz zintegrowany system może działać w dowolnej sali konferencyjnej. Co więcej, wirtualni asystenci mogą również usprawnić konferencje i spotkania w przestrzeni wirtualnej, a nawet więcej – już wkrótce mogą je poprowadzić”, dodaje Casar.

Słowa kluczowe

PAY-ME-ATTENTION, asystent wirtualny, Verbio, przetwarzanie języka naturalnego, spotkanie biznesowe, sztuczna inteligencja, transkrypcja rozmów, rozpoznawanie mówcy

Znajdź inne artykuły w tej samej dziedzinie zastosowania