Ulepszone przetwarzanie treści multimedialnych

Istotność wizualna określa subiektywne znaczenie wybranych obszarów obrazu, które przyciągają uwagę patrzącego. Ulepszenie modeli istotności wizualnej pomoże w wydajniejszym reprezentowaniu materiałów wideo o wysokiej rozdzielczości poprzez odpowiednie skoncentrowanie wysiłku obliczeniowego.

Gospodarka cyfrowa

Pojęcie istotności wizualnej staje się coraz ważniejsze przy komputerowym przetwarzaniu obrazów i filmów o wysokiej rozdzielczości. Jednym z ograniczeń obecnie związanych z materiałami wideo o ultrawysokiej rozdzielczości jest ogromna ilość i złożoność danych obrazu. Wsparcie UE dla projektu "Saliency-aware high-resolution video processing" (SHIVPRO)(odnośnik otworzy się w nowym oknie) umożliwiło opracowanie pilnie potrzebnych ulepszonych modeli istotności. Aby zmierzyć się z problemem złożoności obrazów wieloskalowych, w modelu czasowo-przestrzennym projektu zastosowano funkcje działające na poziomie regionów i miary statystyczne do modyfikowania istotności w wybranej skali. Modyfikacja jest następnie propagowana z wykorzystaniem kierowanego istotnością scalania regionów z elastycznym uwzględnianiem informacji wysokiego poziomu. Pierwszym krokiem było opracowanie modelu istotności na poziomie regionów wykorzystującego histogramy podobieństw barw i położenia oraz stworzenie dwóch miar takich histogramów: rozróżnialności i zwartości. Następnie zajęto się wykrywaniem odpowiednich cech istotnych na podstawie modelu istotności. Naukowcy zaproponowali nowatorską koncepcję w postaci drzewa istotności. Obraz jest upraszczany w celu uzyskania regionów pierwotnych, dla których wartości miar istotności są porównywane w wartościami globalnymi. W procesie scalania regionów generowane jest drzewo, w którym liście reprezentują regiony pierwotne, a pozostałe węzły regiony niepierwotne. Na podstawie systematycznej analizy istotności tworzona jest następnie wysokiej jakości pikselowa mapa istotności. Wykorzystując te modele, badacze stworzyli wydajny model czasowo-przestrzenny istotności na poziomie superpikseli. Z danych superpikseli wyodrębniane są histogramy ruchu i barw. Generowane są mapy istotności przestrzennej i czasowej na poziomie pikseli, które następnie są scalane metodą adaptacyjną. Opracowany model wykazał większą skuteczność wykrywania istotności i przewidywania przyciągania wzroku od najlepszych dotychczasowych rozwiązań w tej dziedzinie. Badacze zajęli się też nową tematyką wykrywania współistotności, czyli identyfikowania obecności tych samych obiektów istotnych na wielu obrazach, proponując do tego zastosowania modele współistotności oparte na segmentacji hierarchicznej. Wykonane prace wniosły znaczny wkład w rozwój dziedziny wydajnego kodowania wideo, umożliwiając zwiększenie wydajności kodowania przy mniejszej złożoności obliczeniowej. Zdolność wyodrębniania subiektywnie istotnych elementów ma duże znaczenie socjoekonomiczne, gdyż może uprościć przetwarzanie ogromnych zestawów danych wideo w zastosowaniach biznesowych, domowych i mobilnych. Naukowcy korzystający z dofinansowania UE w istotny sposób ulepszyli metody modelowania i wykrywania istotności, tworząc rozwiązania przewyższające skutecznością najlepsze dotychczasowe podejścia.

Słowa kluczowe

Znajdź inne artykuły w tej samej dziedzinie zastosowania

Duże zbiory danych gwarantują sprawne decyzje

8 Października 2021

Nowatorskie oprogramowanie oparte na AI pomaga znaleźć inspirację i kreatywność podczas komponowania muzyki

29 Sierpnia 2018

Nowe metody uczenia statystycznego na potrzeby lepszej analizy danych satelitarnych z obserwacji Ziemi

14 Kwietnia 2020

Informacje na temat projektu

SHIVPRO

Identyfikator umowy o grant: 299202

Projekt został zamknięty

Data rozpoczęcia 20 Sierpnia 2012

Data zakończenia 19 Sierpnia 2014

Finansowanie w ramach

Specific programme "People" implementing the Seventh Framework Programme of the European Community for research, technological development and demonstration activities (2007 to 2013)

Koszt całkowity

€ 269 096,40

Wkład UE

€ 269 096,40

269 096,40

Koordynowany przez

UNIVERSITE DE RENNES I
France

Ulepszone przetwarzanie treści multimedialnych

Słowa kluczowe

Znajdź inne artykuły w tej samej dziedzinie zastosowania

Udostępnij tę stronę Udostępnij tę stronę w mediach społecznościowych

Pobierz Pobierz zawartość strony