Descrizione del progetto
Nuovi modelli per garantire l’efficacia delle rappresentazioni video
Sebbene la visione artificiale abbia compiuto passi da gigante nell’applicazione dell’apprendimento profondo alle immagini, i progressi realizzati nel campo delle analisi dei video sono stati più lenti a causa della complessità e della diversità dei relativi dati, che richiedono dataset di addestramento di maggiori dimensioni rispetto alle immagini. I dati video grezzi sono solitamente ad alta dimensionalità, il che rende costosa l’elaborazione su larga scala di interi volumi di pixel video. Sebbene i modelli specifici per i video possiedano proprietà fondamentali, essi sono limitati dalle informazioni di basso livello presenti in tali contenuti, ripercuotendosi negativamente sulla loro capacità, applicabilità e solidità. Il progetto OmniVideo, finanziato dal CER, si prefigge di sviluppare modelli neurali omonimi integrando due approcci al fine di catturare le dinamiche dei video per mezzo dell’impiego di framework basati sull’apprendimento profondo e modelli esterni. L’integrazione effettuata dal progetto intende introdurre metodologie per l’analisi e la sintesi dei video, consentendo la realizzazione di rappresentazioni video fondamentalmente nuove ed efficaci.
Obiettivo
The field of computer vision has made unprecedented progress in applying Deep Learning (DL) to images. Nevertheless, expanding this progress to videos is dramatically lagging behind, due to two key challenges: (i) video data is highly complex and diverse, requiring order of magnitude more training data than images, and (ii) raw video data is extremely high dimensional. These challenges make the processing of entire video pixel-volumes at scale prohibitively expensive and ineffective. Thus, applying DL at scale to video is restricted to short clips or aggressively sub-sampled videos.
On the other side of the spectrum, video-specific models—a single or a few neural networks trained on a single video—exhibit several key properties: (i) facilitate effective video representations (e.g. layers) that make video analysis and editing significantly more tractable, (ii) enable long-range temporal analysis by encoding the video through the network, and (iii) are not restricted to the distribution of training data. Nevertheless, the capabilities, applicability and robustness of such models are hampered by having access to only low-level information in the video
We propose to combine the power of these two approaches by the new concept of Neural OmniVideo Models: DL-based frameworks that effectively represent the dynamics of a given video, coupled with the vast knowledge learned by an ensemble of external models. We are aimed at pioneering novel methodologies for developing such models for video analysis and synthesis tasks. Our approach will have several important outcomes:
• Give rise to fundamentally novel effective video representations.
• Go beyond state-of-the-art in classical video analysis tasks that involve long-range temporal analysis.
• Enhance the perception of our dynamic world through new synthesis capabilities.
• Gain profound understanding of the internal representation learned by state-of-the-art large-scale models, and unveil new priors about our dynamic.
Campo scientifico (EuroSciVoc)
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
- ingegneria e tecnologiaingegneria elettrica, ingegneria elettronica, ingegneria informaticaingegneria informaticatelecomunicazionireti di telecomunicazionereti di dati
È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione
Parole chiave
Programma(i)
- HORIZON.1.1 - European Research Council (ERC) Main Programme
Argomento(i)
Invito a presentare proposte
(si apre in una nuova finestra) ERC-2023-STG
Vedi altri progetti per questo bandoMeccanismo di finanziamento
HORIZON-ERC - HORIZON ERC GrantsIstituzione ospitante
7610001 Rehovot
Israele