Un nuovo sistema di archiviazione dati elimina il supercalcolo su scala exa

I supercalcolatori su scala exa elaborano fino a 1 000 terabyte (TB) di dati al giorno, sebbene il semplice spostamento nel processore richieda ore. Un’innovazione europea rimuove le strozzature.

Economia digitale

I supercalcolatori sono macchine con molti (migliaia) processori che lavorano in parallelo per ottenere tassi di calcolo ben oltre quelli raggiunti dai normali calcolatori. L’ultima generazione è conosciuta come supercalcolatori su scala exa. Definite come quelle che superano il miliardo di miliardi di calcoli al secondo, le macchine più recenti permettono un aumento di velocità di migliaia di volte superiore rispetto al migliore di solo un decennio fa. Tali apparecchiature sono utilizzate in campi di ricerca che richiedono la massima potenza di calcolo, ad esempio: studi meteorologici/climatici, genomica e simulazioni del cervello umano. Le attuali tecnologie di gestione dei dati sono già in difficoltà per sostenere le richieste dei supercalcolatori. Ad esempio, un supercalcolatore convenzionale ad alte prestazioni potrebbe eseguire una simulazione su 8 000 processori che producono 25 TB di dati ogni giorno. L’elaborazione dei dati grezzi moltiplica di due o tre questa quantità. Alcune applicazioni devono già leggere centinaia di terabyte. Ora, con i supercalcolatori su scala exa, le applicazioni che producono petabytes (1 000 TB) saranno all’ordine del giorno. I computer generalmente memorizzano i dati in un posto e li spostano in un altro per l’analisi o l’elaborazione. Attualmente, anche con le migliori reti disponibili, lo spostamento di terabyte o petabyte di dati può richiedere molte ore, il che rappresenta una seria strozzatura. Inoltre, il movimento dei dati richiede un’enorme quantità di energia, nella gamma delle centinaia di megawatt. Rimozione della strozzatura Il progetto SAGE(si apre in una nuova finestra), finanziato dall’UE, ha sviluppato un nuovo sistema di archiviazione dati in grado di soddisfare le esigenze del calcolo su scala exa. L’innovazione riduce al minimo la necessità del trasporto dei dati. «Invece di spostare i dati, il nostro sistema porta il calcolo al sistema di archiviazione», spiega il responsabile del progetto, il dott. Sai Narasimhamurthy. I dati possono essere elaborati nel o vicino al percorso di archiviazione. Le applicazioni di supercalcolo possono passare nei moduli analitici secondo necessità. Il sistema di «archiviazione intelligente» di SAGE comporta inoltre l’ottimizzazione dell’archiviazione dei dati. I dati possono essere memorizzati in uno o più livelli, tra cui: dischi rigidi convenzionali, dischi a stato solido e memoria non volatile, ognuno caratterizzato da determinate proprietà di prestazione. Il sistema SAGE trasferisce i dati al livello con le caratteristiche prestazionali appropriate al momento giusto, con un conseguente miglioramento delle prestazioni. La combinazione di entrambi gli aspetti significa flessibilità e versatilità. Le applicazioni con vari formati di dati complessi possono utilizzare diversi tipi di strumenti di gestione dei dati. Ciò fornisce un’interfaccia di programmazione delle applicazioni potente ed estensibile, anch’essa sviluppata dal team SAGE. Dimostrazione del prototipo Il nostro prototipo era «molto piccolo», aggiunge il dott. Narasimhamurthy, «e in grado di gestire meno di metà petabyte di dati. Inoltre, il nostro software non è ancora ottimizzato». Pertanto, non è realistico confrontare le prestazioni del prototipo con i grandi cluster di produzione. Invece, l’obiettivo principale della squadra era dimostrare che i metodi e le tecniche funzionano; lo fanno, e possono facilmente effettuare l’upscaling su hardware con capacità di archiviazione maggiore. La risposta della comunità scientifica è stata molto positiva. A seguito della dimostrazione di successo, il progetto continuerà come Sage2. Il nuovo progetto estenderà il prototipo SAGE ed esplorerà nuovi modi di utilizzare l’archiviazione di memoria non volatile distribuita, oltre a esaminare l’intelligenza artificiale e le applicazioni di «apprendimento profondo» dei supercalcolatori su scala exa. Il sistema SAGE rimuoverà o ridurrà notevolmente le strozzature che interessano i supercalcolatori su scala exa, consentendo alle macchine di funzionare alla massima velocità. Inoltre, il consumo energetico dovrebbe essere circa 100 volte inferiore a quello utilizzato nei sistemi attuali. Si prevede che il mercato mondiale dell’archiviazione di calcolo ad alte prestazioni raggiungerà i 6 miliardi di dollari nel 2021, mentre il mercato per l’analisi dei megadati e l’archiviazione in cloud sarà ancora maggiore. I progetti SAGE interverranno sulle componenti europee di entrambi i mercati.