Wspólnotowy Serwis Informacyjny Badan i Rozwoju - CORDIS

H2020

EoT — Wynik w skrócie

Project ID: 643924
Źródło dofinansowania: H2020-EU.2.1.1.1.
Kraj: Hiszpania
Dziedzina: Gospodarka cyfrowa

Oczy świata

Pod względem zużycia energii i niezbędnej mocy obliczeniowej sztuczne widzenie jest najbardziej wymagającą formą wykrywania otoczenia. Prace finansowanego przez UE projektu EoT pozwoliły skutecznie rozwiązać ten problem.
Oczy świata
Techniki widzenia komputerowego, czy inaczej sztucznego widzenia, szybko przenoszą się z laboratoriów akademickich do zastosowań praktycznych, w tym do procesów automatyzacji produkcji, przede wszystkim w zakresie kontroli jakości. Dzięki dostępności odpowiednich platform i narzędzi otwierają się zupełnie nowe możliwości w dziedzinie urządzeń ubieralnych, rzeczywistości rozszerzonej, monitoringu, systemów ułatwiających funkcjonowanie w społeczeństwie i wielu innych zastosowaniach.

Widzenie to nasz najbogatszy zmysł, jednak jego działanie wymaga przetwarzania ogromnych zbiorów danych rejestrowanych z otoczenia. Ilość danych generowanych na całym świecie przez czujniki obrazu jest nieporównywalnie większa od ilości danych ze wszystkich innych typów czujników razem wziętych. „Wysiłki projektu EoT pozwoliły po raz pierwszy bezpośrednio zmierzyć się z wyzwaniem, jakie stanowią ogromne wymagania obliczeniowe systemów sztucznego widzenia”, wyjaśnia koordynator projektu EoT, prof. Oscar Deniz Suarez.

„Naszym celem było zbudowanie podstawowej platformy wizyjnej zoptymalizowanej pod kątem poboru mocy, rozmiarów i kosztu, nadającej się zarówno do samodzielnego wykorzystania, jak i do osadzania w najróżniejszych urządzeniach”, wyjaśnia. Choć zdolność wnioskowania na podstawie technik uczenia głębokiego nie znajdowała się na liście pierwotnych celów projektu, konsorcjum projektowe podjęło decyzję o jej późniejszym dodaniu jako bardzo pożądanego wyniku.

Wydajne, wbudowane systemy widzenia komputerowego z technikami uczenia głębokiego

Wynikiem prac jest niezwykle wydajna platforma widzenia komputerowego, której stworzenie było możliwe dzięki dostępności kluczowego komponentu sprzętowego: ultraoszczędnego procesora Movidius Myriad 2. „Kluczowe funkcje platformy to zdolność do wnioskowania z uczeniem głębokim, obsługa Wi-Fi niskiej mocy do oszczędnej wymiany komunikatów i strumieniowego przesyłania wideo, możliwość wysyłania alertów na urządzenia, wewnętrzna ładowarka akumulatora i złącze audio”, wylicza prof. Suarez.

Obecna wersja płytki może łączyć się z trzema kamerami naraz, przy czym wymiary całego układu wynoszą zaledwie 48 x 56 mm. Prace rozwojowe nad płytką wykonano w pierwszej połowie projektu, a główną zasadą prac było usuwanie wszystkich zbędnych komponentów w celu minimalizacji rozmiarów produktu końcowego. Pozwoliło to równolegle pracować nad oprogramowaniem bez znaczącego wpływu na zgodność z istniejącymi urządzeniami.

Trzy prototypy demonstracyjne i mnogość zastosowań

Partnerzy projektu opracowali trzy prototypy demonstracyjne ilustrujące potencjalne zastosowania tej technologii: lalkę z układem wbudowanym w ciało i głowę, zestaw słuchawkowy i system wykrywania zaśmiecania. „Co ważne, wszystkie systemy są projektowane z myślą o ochronie prywatności, więc rejestrowany obraz nie jest w żadnym momencie nagrywany ani wysyłany”, podkreśla prof. Suarez.

Lalka demonstruje skuteczność funkcji uczenia głębokiego poprzez rozpoznawanie sześciu różnych wyrazów twarzy. Według szacunków partnerów projektu EoT takie rozpoznawanie może być wykonywane nieprzerwanie nawet przez 13 godzin, zanim konieczne będzie naładowanie płaskiego akumulatora o pojemności 4000 mAh.

Stworzony specjalnie dla muzeów zestaw słuchawkowy automatycznie rozpoznaje obraz i przekazuje zwiedzającym odpowiednie informacje dźwiękowe. Wbudowana w słuchawki płytka EoT może się również łączyć z aplikacją na smartfonie, aby umożliwić multimedialne zwiedzanie interaktywne. Pilotażowe wdrożenie systemu przeprowadzono w słynnym wiedeńskim muzeum Albertina i na jego podstawie powstanie propozycja nowego projektu zmierzającego do opracowania ostatecznego produktu komercyjnego.

Kolejny system demonstracyjny to „Litterbug” – urządzenie EoT wykrywające śmiecenie, które zapobiega zaśmiecaniu poprzez wykrycie na obrazie z kamery momentu wyrzucenia przedmiotu i emitowanie odpowiednich ostrzeżeń głosowych.

Komercjalizacja: przyszłość widzenia komputerowego

Byli pracownicy firm partnerskich założyli nową firmę Ubotica Technologies, która nie tylko ma licencję na rozwijanie różnego rodzaju produktów wykorzystujących technologię EoT, ale również dysponuje niezbędnym doświadczeniem. „Procesor Myriad 2 stanowiący mózg rozwiązania EoT to skomplikowany układ, który niełatwo jest opanować, zintegrować z innymi komponentami elektronicznymi i wdrożyć”, podkreśla prof. Suarez. Dotyczy to również złożonego oprogramowania niezbędnego do obsługi procesora, czujników, komunikacji, zoptymalizowanego widzenia i wnioskowania opartego na uczeniu głębokim. „Ubotica dysponuje wiedzą fachową pozwalającą w jak najkrótszym czasie opracowywać warianty rozwiązania EoT”, podsumowuje prof. Suarez.

Słowa kluczowe

EoT, uczenie głębokie, widzenie komputerowe, czujnik, sztuczne widzenie, Myriad 2
Śledź nas na: RSS Facebook Twitter YouTube Zarządzany przez Urząd Publikacji UE W górę