La visione artificiale è più vicina grazie alla modellazione umana

Se le macchine potranno mai vedere davvero, ciò potrebbe avere inizio grazie alla modellizzazione di un team europeo su come funzionano i cervelli reali.

Economia digitale

La visione umana è il risultato di processi neurologici molto complessi, raggiunti attraverso la raccolta di moduli cerebrali specializzati, sebbene relativamente semplici, che agiscono assieme. Qualcosa di simile può essere ripetuto nei computer, conferendo loro una sorta di vista. Questa applicazione non è nuova ed è stata testata in vari settori, dai sistemi di sicurezza ai veicoli spaziali o le automobili a guida autonoma. Tuttavia, questi sistemi sono limitati e possono fallire in situazioni nuove. Ad esempio, se un’automobile a guida autonoma non dispone di dati visivi relativi ai deserti, potrebbe avere difficoltà nell’applicare la propria conoscenza dei paesaggi urbani a quell’ambiente. In questo caso, il veicolo potrebbe confondersi e commettere errori. Una visione computerizzata davvero affidabile e autonoma è ancora piuttosto lontana. Oltre alle ovvie applicazioni per le macchine, lo studio della visione computerizzata migliora altresì la comprensione sul funzionamento della vista umana. Il progetto DEEPCEPTION, finanziato dall’UE e intrapreso con il supporto del programma Marie Skłodowska-Curie, ha lavorato su entrambi gli aspetti del problema. I ricercatori del progetto hanno sviluppato modelli di visione artificiale che simulano e illustrano i processi nel cervello umano.

Reti neurali profonde

Le reti neurali prendono ispirazione dai sistemi biologici, attraverso cui una rete di processori informatici possiede un funzionamento analogo ai neuroni (cellule cerebrali). Tali reti utilizzano gli algoritmi per riconoscere degli schemi, senza essere specificatamente programmate per farlo. Una «rete neurale profonda», su cui si basa l’idea del progetto, è simile ma implica molti livelli di elaborazione ed è addestrata per un compito specifico. Il compito di DEEPCEPTION è stato di insegnare ai computer a riconoscere oggetti dalle fotografie. I ricercatori hanno paragonato le risposte delle reti neurali profonde con quelle dei cervelli di primati reali (scimmia e essere umano) nell’osservazione delle stesse immagini. «Se il modello informatico rappresentasse accuratamente il processo biologico reale, la risposta dalla rete neurale e dal cervello dovrebbe quindi corrispondere», spiega Jonas Kubilius, responsabile del progetto. Il team di ricerca ha costruito una serie di benchmark per consentire di valutare e quantificare il livello di corrispondenza dei due processi. Il benchmark neurale e comportamentale integrativo del team, chiamato Brain-Score, è ad oggi il più grande al mondo. Utilizzando le informazioni acquisite da questo confronto, i ricercatori hanno quindi costruito un modello informatico, chiamato CORnet, che ha ottenuto ottimi risultati nei benchmark.

Il modello più accurato

Attualmente, sono pochi i modelli di visione umana che possono prevedere accuratamente la risposta neurale o comportamentale. Il modello di DEEPCEPTION ha superato i sistemi di visione computerizzata più complicati e si avvicina molto alla comprensione attuale migliore su come funzioni il riconoscimento degli oggetti nel sistema visivo dei primati. «Sono stato particolarmente orgoglioso quando il nostro modello è stato in grado di prevedere le risposte neurali su un set di dati completamente nuovo», aggiunge Kubilius. «Tali test su nuovi dati forniscono un mezzo rigoroso contro la falsificazione dei modelli». Se un modello non è in grado di prevedere nulla oltre ai dati su cui è stato addestrato, ciò significa che non rappresenta la comprensione reale. Tuttavia, se un modello realizza buone previsioni su un set di dati completamente nuovi, si tratta di un segno positivo dell’accuratezza del modello. Il progetto ha prodotto un modello migliorato della visione dei primati. Sebbene DEEPCEPTION non avesse scopi commerciali, gli strumenti che ha sviluppato aiuteranno i suoi ed altri ricercatori a sviluppare modelli ancora più accurati.

Parole chiave

DEEPCEPTION, visione, rete neurale, macchina, rete neurale profonda, primate, visione artificiale, modellizzazione, cervello umano, Brain-Score, CORnet

Visual perception in deep neural networks

La visione artificiale è più vicina grazie alla modellazione umana

Reti neurali profonde

Il modello più accurato

Parole chiave

Scopri altri articoli nello stesso settore di applicazione

Condividi questa pagina

Scarica