Servizio Comunitario di Informazione in materia di Ricerca e Sviluppo - CORDIS

FP7

ONTIC Risultato in breve

Project ID: 619633
Finanziato nell'ambito di: FP7-ICT
Paese: Spagna

Una tecnologia migliore per i megadati

Ricercatori finanziati dall’UE hanno creato nuovi concetti informatici e strumenti appositi per supportare le sempre più complesse esigenze delle aziende relative ai megadati.
Una tecnologia migliore per i megadati
Lo sapevate che una tipica rete ISP trasferisce terabyte di dati ogni giorno? Che al giorno d’oggi i dati connettono quasi due miliardi di persone in tutto il mondo, e che si prevede che entro il 2020 il numero di dispositivi collegati a internet superi i 50 miliardi?

Ciò che questi numeri enormi significano è che la già grande quantità di dati che esiste oggi continuerà semplicemente a crescere a una velocità eccezionale. La sfida è quella di identificare e categorizzare con precisione questo traffico di rete in base al tipo di applicazione, ed è questa la sfida di cui si occupa il progetto ONTIC finanziato dall’UE. Il loro obiettivo: sviluppare nuove tecniche per l’analisi e la caratterizzazione delle grandi quantità di traffico di rete che si verificano oggi all’interno delle moderne reti informatiche.

“Un’accurata identificazione e categorizzazione del traffico di rete in base al tipo di applicazione è un elemento importante di molti compiti della gestione della rete e di ingegneria in relazione a qualità del servizio (QoS), pianificazione della capacità e rilevamento degli attacchi alla rete,” afferma Alberto Mozo, ricercatore principale di ONTIC.

Studiare, implementare e testare

Secondo i ricercatori di ONTIC, la gestione intraprendete e dinamica della QoS significa essere in grado di rilevare in anticipo intrusioni nella rete e problemi di congestione. Per fare questo è necessario un meccanismo accurato e scalabile per fornire una caratterizzazione online dell’evoluzione negli schemi del traffico di rete. Il problema, tuttavia, è che gli attuali approcci per la caratterizzazione online del traffico di rete mancano di scalabilità e precisione.

Qui i ricercatori di ONTIC hanno visto un’opportunità per sviluppare una nuova generazione di meccanismi e tecniche scalabili capaci di caratterizzare online il traffico di rete. “Il nostro obiettivo era quello di studiare, implementare e testare una nuova architettura di meccanismi e tecniche per caratterizzare online i flussi di dati del traffico di rete, e di rilevare in tempo reale le anomalie quando viene elaborato un grande volume di pacchetti al secondo,” dice Mozo. “Le nostre tecniche di analisi dei dati sono destinate a identificare le regolarità ricorrenti che si trovano nei modelli descrittivi.”

Il progetto intendeva inoltre sviluppare una nuova serie di meccanismi e tecniche offline per l’estrazione di dati al fine di caratterizzare il traffico di rete, applicare un approccio analitico ai megadati e usare paradigmi di computazione distribuiti nel cloud su grandi set di dati. Allo stesso tempo, i ricercatori hanno integrato i meccanismi e le tecniche online e offline in traffico di rete autonomo controllato o non controllato.

Attenzione concentrata sugli algoritmi scalabili

Non volendo reinventare la ruota, il progetto ha adottato un quadro architettonico già esistente, vale a dire la Big Data Lambda Architecture. “Abbiamo deciso di concentrare la maggior parte dei nostri sforzi sullo sviluppo di algoritmi scalabili in maniera massiccia che potessero essere applicati nel contesto della classificazione del traffico di rete,” afferma Mozo. “Riassumendo, abbiamo concentrato i nostri sforzi non sull’architettura, ma sulla progettazione di nuovi algoritmi e sulla loro applicazione a prototipi per rilevamento delle anomalie, controllo energico della congestione e gestione dinamica di QoS/QoE.”

Visto che il progetto ONTIC intendeva produrre le conoscenze di cui le aziende tecnologiche hanno bisogno per tenere al sicuro i loro dati, esso si è concentrato sulla produzione di articoli scientifici di alta qualità e prototipi quale mezzo per disseminare le sue conclusioni (invece di produrre prodotti o servizi concreti). Uno dei suoi risultati chiave è stato il fatto di rendere il codice per tutti gli algoritmi ONTIC liberamente disponibile attraverso un archivio GitLab soggetto a un accordo di licenza open source.

Quando il progetto si è concluso a gennaio del 2017, esso aveva prodotto un set di dati da 0,5 petabyte disponibile a tutti contenente intestazioni di pacchetti rese anonime che possono essere preziose per altri ricercatori. I ricercatori hanno inoltre sviluppato tre prototipi che hanno dimostrato l’applicabilità dell’apprendimento automatico parallelo al dominio delle telecomunicazioni, in aggiunta a tre invenzioni collegate a questi prototipi e una domanda di brevetto. Inoltre, varie importanti aziende tecnologiche, tra cui Ericsson, Satec e CNRS, hanno tutte intenzione di portare avanti alcune delle invenzioni di ONTIC verso la mercatizzazione.

Keywords

ONTIC, TIC, informatica, megadati, telecomunicazioni
Numero di registrazione: 200825 / Ultimo aggiornamento: 2017-06-29