Insegnare all’IA come addestrarsi autonomamente
Sebbene gli esseri umani utilizzino la vista per fare praticamente tutto, essa è spesso data per scontata. Eppure, essere in grado di dare un senso a un’immagine è un processo straordinariamente complesso. Infatti, alcuni ricercatori stimano che la vista utilizzi circa la metà del cervello. «Questo processo complesso ci permette non solo di vedere una macchina, ma una macchina blu; non solo una persona, ma un uomo che indossa una maglietta rossa», afferma Andrea Vedaldi, professore di visione artificiale e apprendimento automatico presso l’Università di Oxford. Secondo Vedaldi, questa comprensione dettagliata di ciò che vediamo è fondamentale per il processo decisionale. «Se vediamo un semaforo rosso e un altro veicolo che non rallenta, interpretiamo immediatamente l’evento come una situazione potenzialmente pericolosa e agiamo di conseguenza», aggiunge. E qui si pone il problema centrale con l’intelligenza artificiale (IA). Pur facendo un lavoro abbastanza buono nell’identificare gli oggetti, all’IA manca la capacità di interpretare ciò che vede, il che può essere piuttosto problematico in applicazioni quali veicoli autonomi o droni senza pilota. «Mentre i bambini imparano a capire le immagini da soli, con poco o nessun input esterno, all’IA tale abilità deve essere insegnata attraverso una supervisione manuale estesa e dettagliata», spiega Vedaldi. Con il supporto del progetto IDIU, finanziato dall’UE, Vedaldi e il suo team di ricercatori stanno lavorando per realizzare proprio questo compito. «Il nostro obiettivo era quello di sviluppare una nuova generazione di algoritmi di comprensione delle immagini con una potenza e una flessibilità più vicine alla vista umana», osserva.
Nessuna supervisione necessaria
Il progetto IDIU, che ha ricevuto il sostegno del Consiglio europeo della ricerca (CER), affronta una delle principali strozzature della moderna visione artificiale: la necessità di supervisione. Anche se gli algoritmi possono imparare a risolvere complessi compiti di analisi delle immagini, per farlo richiedono in primo luogo migliaia (se non milioni) di esempi etichettati, essenzialmente immagini che sono annotate manualmente con la loro interpretazione. Inutile dire che questa esigenza ha un costo considerevole. Per snellire questo processo, i ricercatori hanno sviluppato diverse nuove tecnologie, tra cui algoritmi che sono in grado di eseguire ricerche in modo autonomo. A tal fine, essi consultano automaticamente risorse Internet come Google e Wikipedia e si avvalgono di un nuovo approccio matematico che consente loro di apprendere la geometria degli oggetti in immagini e video senza che sia necessaria una fonte esterna di supervisione. «Per la prima volta, abbiamo dimostrato che è possibile apprendere la struttura spaziale degli oggetti semplicemente guardando le immagini, senza alcuna supervisione esterna», afferma Vedaldi. «In altri termini, un algoritmo può imparare autonomamente che una persona ha due braccia, due gambe e una determinata posizione.»
Flessibilità simile a quella umana
Sebbene l’IA sia ancora lontana dall’eguagliare l’intelligenza umana, gli sviluppi raggiunti dal progetto IDIU le danno un livello di flessibilità ad essa analoga. «Facendo da pioniere in una nuova sottoarea dell’IA, che chiamiamo apprendimento interno, questo progetto avrà un impatto decisivo sulla ricerca futura e sull’industria», aggiunge. Questo impatto è già in essere, poiché i risultati del progetto sono attualmente utilizzati in una sovvenzione di consolidamento del CER. «Usando i risultati dell’IDIU come base, stiamo ora costruendo macchine che possono imparare a vedere in modo completamente automatico attraverso l’ingestione passiva di immagini e video registrati casualmente», conclude Vedaldi. «Ci aspettiamo che questa tecnologia renda la visione artificiale molto più facilmente applicabile, e quindi flessibile e utile, per molte delle applicazioni critiche del futuro.»
Parole chiave
IDIU, intelligenza artificiale, IA, algoritmi, visione artificiale, apprendimento automatico