L’IA per un monitoraggio del traffico di qualità in tempo reale
La crescita della popolazione urbana, unita all’aumento dei veicoli di proprietà, ha promosso lo sviluppo e l’installazione di sistemi di monitoraggio del traffico, per contrastare la congestione e garantire la sicurezza stradale. Il monitoraggio stradale attraverso telecamere si fa sempre più diffuso, ma gran parte delle reti di comunicazione mondiali ha una larghezza di banda troppo limitata per trasmettere registrazioni di alta qualità, compromettendo il processo decisionale degli operatori del traffico. Il progetto VISIONS, finanziato dal programma di azioni Marie Skłodowska-Curie (MSCA), ha usato l’apprendimento automatico per elaborare e trasmettere video, offrendo un monitoraggio del traffico in tempo reale di qualità. In futuro l’algoritmo VISIONS sarà disponibile come pacchetto software, che potrà essere scaricato sulle telecamere in funzione o integrato in nuovi dispositivi, contribuendo all’obiettivo dell’UE di azzerare le vittime della strada entro il 2050.
Ottimizzazione video end-to-end
Per ampliare al massimo la larghezza di banda di rete disponibile per il sistema di monitoraggio del traffico, il progetto VISIONS ha approfondito alcune soluzioni di apprendimento automatico sia per l’elaborazione video che per lo streaming. Nell’ambito dell’elaborazione, le telecamere caricano video a bassa risoluzione, migliorati dall’algoritmo di VISIONS che li ricostruisce grazie a tecniche come la super risoluzione. Per quanto riguarda lo streaming, VISIONS sfrutta l’apprendimento per rinforzo profondo (DRL, Deep Reinforcement Learning) per regolare il bit rate dei video in tempo reale, consentendo al sistema di adattarsi a dinamiche di rete inaspettate (come le richieste concorrenti di altri servizi) e di migliorare l’esperienza degli utenti. «Data la limitata capacità di calcolo e il basso consumo energetico delle telecamere di monitoraggio del traffico, il nostro modello di rete neurale può funzionare in modo affidabile su telecamere con risorse di calcolo limitate», osserva Xu Zhang, borsista MSCA. In futuro, per garantire agli utenti una visione il più possibile di alta qualità e massimizzare la larghezza di banda, il sistema calcolerà una sorta di compromesso, come spiega Zhang: «Se le strutture dell’utente finale sono potenti, VISIONS trasmetterà video a bassa risoluzione nella rete, ricostruendoli per aumentarne la qualità per il cliente e usando così meno larghezza di banda. Se invece l’utente finale ha meno risorse computazionali, è necessario trasmettere video a risoluzione più alta, consumando una larghezza di banda molto maggiore.»
Test simultanei degli algoritmi
Il sistema è stato sviluppato tramite l’API TensorFlow di Python. L’équipe ha sviluppato, in particolare, un ambiente di simulazione che ingerisce video ricavati da streaming del traffico reali. Inoltre, sono stati addestrati simultaneamente diversi modelli, ognuno basato su diversi dati di rete e video provenienti da set di dati pubblici, rendendo il sistema complessivamente più robusto. Sono stati impiegati dati di caricamento a banda larga forniti dalla Federal Communications Commission, dati sulla larghezza di banda wireless 4G provenienti da dispositivi mobili della città di Gand, e registrazioni della larghezza di banda HSDPA 3G raccolti da scenari di streaming HTTP mobile. Per valutare le prestazioni, l’algoritmo di VISIONS è stato confrontato con altri metodi d’avanguardia, in base a criteri come il consumo di banda, la fluidità del video, la perdita di fotogrammi e il blocco dell’immagine. «Il nostro algoritmo è in grado di ridurre il numero di fotogrammi persi e il blocco dell’immagine rispettivamente del 24 % e del 15,5 %, pur non richiedendo una larghezza di banda maggiore», spiega Zhang.
Rilevanza per altri sistemi multimediali
VISIONS ha dedicato la sua attenzione allo streaming video verso i centri di controllo, aiutando gli operatori a osservare da remoto il flusso del traffico, per identificare e rispondere rapidamente a emergenze o code. «In futuro indagheremo la possibilità di trasmettere i video del traffico ai sistemi di intelligenza artificiale, per analizzarli e segnalare i problemi. Nel frattempo, i nostri risultati potrebbero essere utili ad altri sistemi che si basano su applicazioni multimediali, come le applicazioni di realtà virtuale, di istruzione a distanza e di assistenza sanitaria», conclude Zhang.
Parole chiave
VISIONS, video, bit rate, intelligenza artificiale, apprendimento automatico, traffico, strada, monitoraggio, streaming, larghezza di banda