Descrizione del progetto
Il sistema visivo ispira trasformatori biologicamente plausibili per l’apprendimento profondo
L’apprendimento profondo è un tipo di apprendimento automatico che insegna ai computer a elaborare le informazioni alla maniera del cervello umano e contiene reti neurali multistrato che rappresentano diversi livelli, o fasi, di elaborazione delle informazioni. La dimensione e la complessità di tali reti ha comportato il grande successo di queste tecnologie, ma anche un consumo energetico sempre più proibitivo. Alla luce di questo contesto, un’alternativa promettente è rappresentata dalle strutture biologicamente plausibili. Con il sostegno del programma di azioni Marie Skłodowska-Curie, il progetto BiTFormer si propone di sfruttare le dinamiche multiscala del sistema di visione primario per indagare architetture biologicamente plausibili per i trasformatori, elementi cruciali dell’apprendimento profondo. Se avrà successo, potrà applicarle all’hardware opto-analogico biologicamente plausibile già a disposizione del progetto, con prestazioni pari a quelle dell’apprendimento profondo digitale per le reti feedforward.
Obiettivo
Deep learning (DL) has recently achieved remarkable success due to the continuous growth in model sizes. However, this growth has led to increased energy consumption. Hardware implementation of digital DL can help reduce energy usage, but the Von Neumann architecture of current DL has hindered its practical realization. In contrast, the brain exhibits energy-efficient multiscale spatiotemporal processing. Biologically plausible (BiP) frameworks have emerged as alternatives to mainstream DL. These methods use bottom-up and top-down signals, incorporating feedforward and feedback mechanisms, and local objectives instead of global error. Recently, I demonstrated that a BiP opto-analog hardware can achieve competitive performance compared to digital DL for feedforward networks. However, transformers, the backbone of current DL, are challenging to implement due to the input-dependent quadratic complexity in the transformer's attention. This project leverages the multiscale dynamics in the primary vision system to explore BiP architectures for transformers.
The project is hosted at the University of Tübingen under Matthias Bethge and Thomas Euler, who have a long-standing effort in the system identification of mouse retina via DL. The project has three objectives. First, I will extract top-down information from neural recordings of ganglion cells in the mouse retina, focusing on unique spatiotemporal features that maximally activate specific cell types. Next, I will combine top-down signals with bottom-up models of the retina using recurrent architectures with linear complexity and compare their performance in classification tasks to a vision transformer for the retina. Lastly, I propose a BiP transformer with local weight updates. I will examine the robustness of models under data distribution shifts and noise injection. A positive outcome of the project will address energy and cost issues of AI and help me progress my academic career in this interdisciplinary field.
Campo scientifico (EuroSciVoc)
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione
Parole chiave
Programma(i)
- HORIZON.1.2 - Marie Skłodowska-Curie Actions (MSCA) Main Programme
Invito a presentare proposte
(si apre in una nuova finestra) HORIZON-MSCA-2023-PF-01
Vedi altri progetti per questo bandoMeccanismo di finanziamento
HORIZON-TMA-MSCA-PF-EF - HORIZON TMA MSCA Postdoctoral Fellowships - European FellowshipsCoordinatore
72074 Tuebingen
Germania