Servizio Comunitario di Informazione in materia di Ricerca e Sviluppo - CORDIS

I ricercatori dell’UE sfruttano il potenziale dei big data

Fornire ai ricercatori europei un accesso più facile alle soluzioni di gestione dei dati e ai grandi sistemi di archiviazione vicini ai supercomputer più potenti d’Europa, consentendo al tempo stesso di spostare grandi quantità di dati attraverso i confini, è l’obiettivo principale del progetto EUDAT2020.
I ricercatori dell’UE sfruttano il potenziale dei big data
Per rimanere all’avanguardia, ricercatori europei in una vasta gamma di discipline devono essere in grado di preservare e accedere a masse di dati nonché di promuovere collaborazioni transfrontaliere. EUDAT2020 mira a favorire esattamente questo.

Basandosi su progetti precedenti finanziati dall’UE, questa iniziativa ha riunito una rete di organizzazioni di ricerca europee e centri di elaborazione dati di 14 paesi per creare un’infrastruttura paneuropea di dati collaborativi (CDI). Nell’aprile del 2018, 23 partner hanno aderito formalmente alla CDI.

Il coordinatore del progetto, Damien Lecarpentier della CSC in Finlandia, discute i risultati del progetto e il suo ruolo nel contribuire a garantire la futura eccellenza della ricerca europea.

Abbiamo sentito parlare di big data in grado di creare nuove opportunità per i ricercatori. Ma quali sono state alcune delle sfide?

L’Unione europea e i suoi Stati membri hanno investito molto negli ultimi anni per rendere disponibili griglie distribuite e servizi di calcolo ad alte prestazioni (HPC) a ricercatori in una vasta gamma di settori. La sfida consiste nel fatto che la rapida crescita dei dati, grazie a nuovi e potenti strumenti scientifici, a simulazioni e alla digitalizzazione delle risorse esistenti, richiede nuovi modi di organizzare ed elaborare la quantità di informazioni attualmente disponibili. Dobbiamo sviluppare un approccio più coerente alla gestione dei dati, e questo è il tema del progetto. Volevamo collegare i centri dati per supportare meglio le diverse comunità di ricerca.

Può fare alcuni esempi specifici di tali sfide?

Nella scienza della terra solida, i dati raccolti comprendono dati in tempo reale e dati non in linea (come immagini, video e strutture organizzate di dati memorizzati nei database). Questi diversi tipi di dati hanno requisiti tecnici diversi in termini di accesso e conservazione. Nella comunità biomedica, una sfida chiave consiste nel garantire l’accesso ai dati preservando i requisiti legali di anonimato e riservatezza dei pazienti. Tutti i campi di ricerca, comprese le scienze sociali e umanistiche, affrontano sfide legate alla gestione delle copie di dati e all’accesso a questi dati in un ambiente con più utenti.

Che ruolo hanno avuto i ricercatori in questo progetto?

Fin dall’inizio, le comunità di ricerca sono state al posto di guida in termini di selezione dei servizi di dati. Hanno anche partecipato direttamente, attraverso squadre multidisciplinari, alla progettazione e allo sviluppo di questi servizi. Il progetto ha riunito oltre 50 comunità di ricerca in una vasta gamma di discipline, ognuna con specifiche esigenze e conoscenze. Questi requisiti andavano dalla necessità di replicare i dati per una maggiore disponibilità e di garantire la sicurezza dei dati sensibili per poter condividere i dati al di fuori della comunità iniziale.

Le comunità di ricerca più recenti spesso progettano ancora i processi relativi ai flussi di dati di base e sono interessate a sperimentare varie soluzioni prima di impegnarsi. Le comunità più mature hanno solitamente un’infrastruttura di lavoro esistente.

Laddove possibile, abbiamo considerato i servizi esistenti come opportunità e abbiamo cercato di supportarli fornendo alle comunità la possibilità di estendere il proprio ambiente di elaborazione e archiviazione utilizzando l’infrastruttura CDI. Ciò significava considerare le comunità di ricerca come fornitori di servizi e non solo come clienti.

In che modo il progetto andrà a vantaggio dei ricercatori?

Le comunità di ricerca coinvolte nel progetto sono state in grado di pianificare, attuare e utilizzare i servizi di gestione dei dati su scala europea. I settori scientifici coperti comprendono le scienze sociali e umanistiche, le scienze della terra e dell’atmosfera, le scienze del clima, la biodiversità, le scienze della vita e la fisica.

In passato, se dovevo accedere a un sistema di archiviazione in cui potevo analizzare anche i miei dati, potevo parlare con i miei centri di elaborazione e calcolo dati a livello locale. Ma questo riguarderebbe solo gli utenti locali, appartenenti allo stesso paese. Lo spostamento dei dati attraverso i confini o la condivisione di dati e strumenti con colleghi all’estero spesso richiedeva una soluzione su misura, che semplicemente non è scalabile. Questo partenariato sostenibile, in cui tutti i partner condividono una visione comune, ha aperto l’accesso agli strumenti di dati a livello europeo e consente di attivare collaborazioni europee molto più rapidamente.

Il progetto ha anche reso i fornitori di servizi di archiviazione e gestione dei dati molto più consapevoli delle esigenze delle comunità di ricerca. Ciò include i loro requisiti di gestione dei dati, nonché il modo in cui organizzano le loro particolari infrastrutture di ricerca: per esempio, se scelgono di gestire i propri servizi di gestione dei dati o se utilizzano servizi preesistenti che richiedono adattamenti speciali.

Quali sono stati i fattori chiave del successo del progetto?

Questi risultati sono stati resi possibili da un progetto generosamente finanziato dall’UE e da un gruppo di partner di progetto altamente coinvolti. Basandoci su esperienze di progetti precedenti e lavorando insieme, siamo riusciti a creare una cultura unica per lo scambio di conoscenza aperto e la collaborazione. Abbiamo creato EUDAT CDI come un modo per preservare e continuare questa eredità.

Come sarà garantita questa eredità?

Nell’ultimo anno del progetto, ci siamo concentrati sul passaggio da una base di progetto a un’organizzazione sostenibile. I partner EUDAT si sono impegnati a sostenere la CDI e i suoi servizi per un periodo iniziale di 10 anni. Abbiamo inoltre istituito una segreteria per coordinare lo sviluppo e il funzionamento dell’infrastruttura CDI e nel febbraio 2018 è stata costituita ufficialmente una società a responsabilità limitata. Funzionerà senza fini di lucro rappresentando la voce delle organizzazioni europee che collaborano come parte di CDI EUDAT, fornendo servizi relativi alla conservazione di dati scientifici e di ricerca e alla gestione del ciclo di vita.

Per quanto riguarda il futuro, EUDAT CDI è un’organizzazione in crescita basata su un accordo contrattuale tra i suoi membri. È uno dei pilastri principali di European Open Science Cloud, un cloud per i dati di ricerca in Europa. CDI è un’impresa aperta e accoglie i fornitori di servizi che desiderano unirsi alla rete con vari livelli di coinvolgimento e integrazione.

Fonte: Intervista tratta da research*eu results magazine n. 74

Informazioni correlate

Programmi

Paesi

  • Finlandia