Skip to main content

A Sequence Classification Framework for Human Language Technology

Article Category

Article available in the folowing languages:

W jaki sposób maszyny interpretują ludzki język?

Dzięki rozszerzaniu naszej wiedzy na temat interpretacji ludzkiego języka przez systemy automatyczne zespół projektu SEQCLAS przyczynił się do zbudowania fundamentów pod dalszy rozwój opartych na sztucznej inteligencji technologii wykorzystujących tekst i mowę.

Gospodarka cyfrowa

Wiele osób próbuje uczyć się płynnego posługiwania językiem obcym ucząc się na pamięć list słówek oraz studiując reguły gramatyczne. Niestety, takie podejście zwykle nie przynosi doskonałych rezultatów, ponieważ nauka języka wymaga zdobywania doświadczeń w wyniku słuchania, czytania oraz mówienia. Nie inaczej jest w przypadku rozwoju technologii opartych na języku ludzkim, takich jak rozpoznawanie mowy, systemy tłumaczenia maszynowego czy rozpoznawania tekstów na obrazach. Najważniejsze osiągnięcia ostatnich lat opierały się na znaczącym rozwoju technologii sztucznej inteligencji, a w szczególności sieci neuronowych trenowanych na podstawie rzeczywistych danych, co pozwoliło na rozpoznawanie języków i tłumaczenie tekstów z większą dokładnością niż do tej pory. Zespół projektu SEQCLAS postanowił znaleźć elementy wspólne dla wszystkich trzech technologii, aby jeszcze lepiej wykorzystać ich pełen potencjał. W ramach prac sfinansowanych z budżetu Europejskiej Rady ds. Badań Naukowych (ERBN) badacze przyglądali się temu zagadnieniu z punktu widzenia kompleksowych ram opartych na statystycznej teorii decyzji. Przeprowadzone prace mogą umożliwić zespołom pracującym nad technologiami wykorzystującymi język ludzki krytyczną ocenę algorytmów oraz ich dalsze doskonalenie.

„Mieć” a „miedź”

„We wszystkich trzech obszarach zastosowań kontekst odgrywa kluczowe znaczenie – pozwala bowiem lepiej interpretować dane wejściowe i prowadzi do wygenerowania odpowiednich danych wyjściowych”, wyjaśnia Hermann Ney, kierownik Grupy ds. Technologii Językowych oraz Rozpoznawania Wzorców na Politechnice w niemieckim Akwizgranie oraz główny badacz projektu SEQCLAS. W przypadku języka, kontekst ma jednak złożony i wielowymiarowy charakter. W jaki sposób maszyna może nauczyć się odróżniać słowa takie jak „mieć” i „miedź”, by dokonać ich prawidłowej transkrypcji? Co może pozwolić jej dokładniej przewidywać, który „zamek” ma na myśli użytkownik, by wybrać właściwe tłumaczenie? „Jeśli przyjrzymy się na przykład rozpoznawaniu mowy, każdy dźwięk musi być traktowany jako część sekwencji – słowa, zdania, a nawet dialogu, aby poprawnie zinterpretować jego znaczenie”, wyjaśnia Ney. Przetwarzanie i klasyfikowanie takich sekwencji pozwoli sieciom neuronowym na rozpoznawanie wzorów, na podstawie których powstają. Zespół projektu SEQCLAS przyglądał się bliżej temu wyzwaniu z punktu widzenia teorii decyzji, której ramy podkreślają znaczenie kryterium wykonania – na przykład liczby błędów – w realizacji zadań przetwarzania sekwencji. „W rezultacie kryterium to można wykorzystać do usprawnienia struktury oraz szkolenia systemów opartych na sieciach neuronowych”, zauważa Ney. Badacz przyznaje także, że w przypadku tłumaczeń maszynowych ocena wykonania może nastręczać dodatkowych trudności ze względu na istnienie różnych możliwych interpretacji i tłumaczeń.

Informacje na temat postępów

W ramach dopełnienia przeprowadzonych prac koncepcyjnych, badacze opracowali szereg modeli i testów, które pozwoliły zobaczyć wyniki ich badań w praktyce. W tym celu wykorzystali uczenie nienadzorowane oraz częściowo nadzorowane, aby umożliwić tłumaczenie maszynowe z wykorzystaniem jednojęzycznych danych w językach źródłowych i docelowych. Przeprowadzone prace mogą na przykład przyczynić się do udostępnienia lepszych silników tłumaczenia maszynowego dla mniej popularnych par językowych. Wraz z pozostałymi badaczami, Ney opracował także szereg prototypów systemów, które zostaną wykorzystane w dalszych badaniach tej niezwykle obiecującej dziedziny. Naukowiec wierzy w to, że kompleksowe podejście opracowane w ramach projektu stanowi również wyjątkową perspektywę historyczną dotyczącą koncepcji leżących u podstaw technologii opartych na języku ludzkim. „Zwykle zapominamy, że sieci neuronowe są wykorzystywane do rozpoznawania mowy już od przeszło trzydziestu lat. Rozwój tej technologii był przez długi czas ograniczony przez brak odpowiednio dużych mocy obliczeniowych”, dodaje Ney. „Ponowna ocena i aktualizacja dotychczasowych badań z punktu widzenia współczesnych możliwości oraz nowych informacji może pozwolić nam na osiągnięcie prawdziwych przełomów w tej dziedzinie”.

Słowa kluczowe

SEQCLAS, technologie oparte na języku ludzkim, rozpoznawanie mowy, rozpoznawanie tekstu, tłumaczenie maszynowe, sieć neuronowa, algorytm, uczenie nienadzorowane, uczenie częściowo nadzorowane

Znajdź inne artykuły w tej samej dziedzinie zastosowania