Skip to main content
European Commission logo print header

Sparse Online Learning

Article Category

Article available in the following languages:

Sprawniejsze przetwarzanie i ekstrakcja danych w czasie rzeczywistym

Szybsza metoda gromadzenia i przetwarzania danych wejściowych powinna umożliwić budowę bardziej wydajnych urządzeń na potrzeby biomedycyny i innych dziedzin.

Gospodarka cyfrowa icon Gospodarka cyfrowa

W świecie, w którym ilość informacji rośnie w zawrotnym tempie, gromadzenie i wyodrębnianie odpowiednich danych jest niezbędne dla tworzenia bardziej skutecznych rozwiązań technologicznych i projektowania szybszych urządzeń. Sposobem na obliczeniowe wykonanie tego zadania jest usuwanie nadmiarowych danych przy pomocy udoskonalonego modelowania "rzadkiego", będącego dynamicznie rozwijającą się dziedziną, łączącą statystykę, uczenie maszynowe i przetwarzanie sygnału. Z punktu widzenia techniki komputerowej, modele rzadkie zawierają głównie zera i tylko kilka parametrów niezerowych oraz wykorzystują nowe narzędzia teoretyczne i algorytmiczne. W tym kontekście, uczestnicy projektu SOL (Sparse Online Learning), finansowanego ze środków UE, podjęli prace nad nową teorią i algorytmami do uwzględniającego rzadkość uczenia się "na bieżąco". Zamiast zapisywania danych i następnie ich przetwarzania, uczestnicy projektu chcieli, by były one przetwarzane natychmiast w czasie rzeczywistym, gdy tylko staną się dostępne. Aby zrealizować przyjęte założenia, zespół opracował potrzebne algorytmy uwzględniające rzadkość, w sposób umożliwiający efektywną pracę w czasie rzeczywistym. Uczeni połączyli zaawansowane struktury rzadkości w model uczenia online i udoskonalili proces uczenia poprzez gromadzenie danych z wielu urządzeń sensorycznych i typologii wykorzystujących wspólne struktury rzadkości. Opracowano platformę, która precyzyjnie ocenia nowo opracowane techniki w porównaniu z konkurencyjnymi rozwiązaniami. Po zastosowaniu nowo opracowanych technik w branży biomedycznej, uczestnicy projektu SOL stworzyli innowacyjny bezprzewodowy system monitorowania elektrokardiogramu (EKG), który jest bardziej energooszczędny i potencjalnie bardziej skuteczny niż dotychczas stosowane technologie EKG. Zespół uwzględnił też bardziej ogólne przypadki, w których struktury rzadkość i struktury zaawansowane są wykorzystywane w faktoryzacji i analizie macierzy danych. Badano zadania ogólne obejmujące śledzenie podprzestrzeni, uczenie się słowników online i rozproszonych oraz opartą na uczeniu się słownikowym faktoryzację macierzy w analizie czynnościowego obrazowania metodą rezonansu magnetycznego (fMRI). Nowe alternatywne narzędzia matematyczne obejmujące randomizowane projekcje zastosowano do redukcji wymiarowości i przystosowano do wcześniej opracowanych algorytmów, skracając czas analizy danych fMRI. Następnie opracowano nową metodę regresji liniowej opartą na randomizowanych projekcjach i przeznaczoną do zastosowań dotyczących dużych zbiorów danych. Nowe algorytmy i techniki modelowania, analizy i/lub rekonstrukcji sygnałów okazały się bardzo użyteczne, szczególnie dlatego, że działają w trybie online a nie w sposób wsadowy. Umożliwia to bardzo wydajne przetwarzanie dużych ilości danych, otwierając drogę stworzeniu nowych zastosowań wymagających takiej złożoności. Rezultaty projektu opisano w prestiżowych czasopismach, kilku rozdziałach książkowych i wielu publikacjach konferencyjnych.

Słowa kluczowe

Przetwarzanie danych, modelowanie rzadkie, uczenie maszynowe, przetwarzanie sygnału, regresja liniowa, SOL

Znajdź inne artykuły w tej samej dziedzinie zastosowania