Skip to main content

Integrated and Detailed Image Understanding

Article Category

Article available in the folowing languages:

Uczenie sztucznej inteligencji, jak ma się sama uczyć

Nowe algorytmy mają umożliwić sztucznej inteligencji nie tylko identyfikowanie obiektów, ale także interpretowanie tego, co widzi.

Gospodarka cyfrowa

Wzrok jest naszym głównym zmysłem, przez co traktujemy takie możliwości za oczywiste. Tymczasem okazuje się, że umiejętność nadania sensu obrazowi to niezwykle złożony proces. Niektórzy badacze szacują, że mniej więcej połowa procesów mózgowych służy wyłącznie obsłudze zmysłu wzroku. „Ten złożony proces pozwala nam nie tylko zobaczyć samochód, ale niebieski samochód, nie tylko osobę, ale mężczyznę w czerwonej koszulce”, mówi Andrea Vedaldi, profesor widzenia komputerowego i uczenia maszynowego na Uniwersytecie Oksfordzkim. Według Vedaldiego to szczegółowe zrozumienie tego, co widzimy, ma kluczowe znaczenie dla podejmowania decyzji. „Jeśli widzimy czerwone światło i inny pojazd nie zwalnia, natychmiast interpretujemy to jako sytuację potencjalnie niebezpieczną i podejmujemy odpowiednie działania”, dodaje uczony. Tu właśnie pojawia się zasadniczy problem ze sztuczną inteligencją (SI). Chociaż sztuczna inteligencja radzi sobie z identyfikowaniem obiektów, brakuje jej umiejętności interpretacji tego, co widzi. To może być dość problematyczne, gdy będziemy chcieli stosować ją w pojazdach autonomicznych czy dronach bezzałogowych. „Dzieci uczą się rozumieć obrazy samodzielnie, korzystając przy tym z niewielkiej lub żadnej pomocy z zewnątrz, natomiast sztuczną inteligencję musimy nauczyć tego ręcznie, w obszernym i szczegółowym procesie nadzoru”, wyjaśnia Vedaldi. Dzięki wsparciu finansowanego przez UE projektu IDIU Vedaldi i jego zespół naukowców starają się opracować odpowiednie procedury. „Naszym celem było opracowanie nowej generacji algorytmów rozumienia obrazu o mocy i elastyczności bliższej ludzkiemu wzrokowi”, zauważa badacz.

Bez nadzoru

Projekt IDIU, wspierany przez Europejską Radę ds. Badań Naukowych (ERBN), podejmuje problematykę jednego z głównych wąskich gardeł tematyki nowoczesnego widzenia komputerowego: potrzeby nadzoru. Mimo że algorytmy mogą nauczyć się rozwiązywać złożone zadania z zakresu analizy obrazu, wymaga to tysięcy – jeśli nie milionów – opisanych przykładów, zasadniczo obrazów, którym interpretację przypisuje się ręcznie. Nie trzeba dodawać, że wiąże się to ze znacznymi kosztami. Aby usprawnić ten proces, naukowcy opracowali kilka nowych technologii, w tym algorytmy, które mogą „przeprowadzać własne badania”. Mogą to robić automatycznie, konsultując się z zasobami internetowymi, na przykład bazami Google i Wikipedii, a także dzięki nowemu matematycznemu podejściu do uczenia się geometrii obiektów na podstawie obrazów i filmów bez konieczności korzystania z zewnętrznego źródła nadzoru. „Po raz pierwszy pokazaliśmy, że SI może rozpoznawać przestrzenne kształty obiektów, po prostu analizując te obrazy, bez zewnętrznego nadzoru”, mówi Vedaldi. „Innymi słowy, algorytm może samodzielnie nauczyć się, że dana osoba ma dwie ręce, dwie nogi i określoną pozę”.

Elastyczność zbliżona do ludzkiej

Chociaż sztucznej inteligencji wciąż daleko do ludzkiej, osiągnięcia projektu IDIU zapewniają jej podobny do ludzkiego poziom elastyczności. „Jesteśmy pionierami w nowej poddziedzinie sztucznej inteligencji, którą nazywamy uczeniem wewnętrznym. Ten projekt będzie miał duży wpływ na przyszłe badania i przemysł”, dodaje uczony. Wpływ ten jest już widoczny, ponieważ wyniki projektu są obecnie wykorzystywane w ramach grantu konsolidacyjnego ERBN. „Używając odkryć IDIU jako podstawy, budujemy maszyny, które mogą uczyć się widzieć całkowicie automatycznie poprzez pasywne przyjmowanie przypadkowo nagranych obrazów i filmów”, podsumowuje Vedaldi. „Uważamy, że ta technologia ułatwi stosowanie widzenia komputerowego, a tym samym uelastyczni je i zwiększy jego zastosowanie dla przyszłych aplikacji”.

Słowa kluczowe

IDIU, sztuczna inteligencja, SI, algorytmy, widzenie komputerowe, uczenie maszynowe

Znajdź inne artykuły w tej samej dziedzinie zastosowania