Opis projektu
Uczenie samochodów jazdy w sposób, w jaki robią to ludzie
Od pojazdów połączonych z siecią po samochody autonomiczne, pojazdy bez kierowcy na pokładzie zrewolucjonizują w najbliższych latach oblicze transportu. Producenci tradycyjnych samochodów prześcigają się w opracowywaniu w pełni autonomicznych pojazdów w celu zaspokojenia (przyszłego) popytu. Grunt pod tę transformację przygotowywany jest poprzez rozwijanie autonomicznych algorytmów rozpoznawania obrazów. W ramach finansowanego ze środków UE projektu VUAD opracowana zostanie metoda uczenia głębokiego w zakresie śledzenia wielu obiektów na podstawie danych o strukturze grafowej. Działania w ramach projektu zostaną rozszerzone również na połączenie wykrywania i śledzenia obiektów na podstawie obrazu wideo poprzez wykorzystanie czasowych sygnałów w celu poprawy wydajności tych funkcji. Ponadto zespół projektu VUAD zaproponuje model ruchu w tle dla statycznych części otoczenia w nienadzorowany sposób. Celem jest połączenie proponowanych algorytmów w jednolity moduł zdolny do interpretacji obrazów wideo.
Cel
Autonomous vision aims to solve computer vision problems related to autonomous driving. Autonomous vision algorithms achieve impressive results on a single image for various tasks such as object detection and semantic segmentation, however, this success has not been fully extended to video sequences yet. In computer vision, it is commonly acknowledged that video understanding falls years behind single image. This is mainly due to two reasons: processing power required for reasoning across multiple frames and the difficulty of obtaining ground truth for every frame in a sequence, especially for pixel-level tasks such as motion estimation. Based on these observations, there are two likely directions to boost the performance of tasks related to video understanding in autonomous vision: unsupervised learning and object-level reasoning as opposed to pixel-level reasoning. Following these directions, we propose to tackle three relevant problems in video understanding. First, we propose a deep learning method for multi-object tracking on graph structured data. Second, we extend it to joint video object detection and tracking by exploiting temporal cues in order to improve both detection and tracking performance. Third, we propose to learn a background motion model for the static parts of the scene in an unsupervised manner. Our long-term goal is also to be able to learn detection and tracking in an unsupervised manner. Once we achieve these stepping stones, we plan to combine the proposed algorithms into a unified video understanding module and test its performance in comparison to static counterparts as well as the state-of-the-art algorithms in video understanding.
Dziedzina nauki (EuroSciVoc)
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.
- nauki przyrodniczeinformatykasztuczna inteligencjauczenie maszynoweuczenie nienadzorowane
- nauki przyrodniczeinformatykasztuczna inteligencjarozpoznawanie obrazówwykrywanie obiektów
- nauki przyrodniczeinformatykasztuczna inteligencjauczenie maszynoweuczenie głębokie
Aby użyć tej funkcji, musisz się zalogować lub zarejestrować
Program(-y)
Temat(-y)
System finansowania
MSCA-IF-EF-ST - Standard EFKoordynator
34450 Istanbul
Turcja