Description du projet
Un intergiciel qui optimise le mouvement des données grâce à des paradigmes de prise en compte de la mémoire et des données
L’intergiciel est le pont qui relie les fonctions du système d’exploitation et les bases de données aux applications qui en dépendent. À l’ère du calcul haute performance (CHP) et de l’analyse des données haute performance (HPDA) la capacité de calcul en virgule flottante (c’est-à-dire la puissance de calcul brute), ne constitue plus le goulot d’étranglement des performances. Les restrictions de performance sont désormais principalement liées au mouvement des données dans les systèmes de mémoire et de stockage. Le projet MAESTRO, financé par l’UE, se propose de répondre à la nécessité d’un cadre intergiciel qui prend en compte les données et la mémoire pour traiter des volumes de données sans cesse croissants. Cela facilitera l’optimisation du traitement des données grâce à une plus grande abstraction des modèles de données, à une gestion innovante des flux de travail et à un approvisionnement dynamique. À terme, cela permettra d’améliorer les performances de calcul.
Objectif
Maestro will build a data-aware and memory-aware middleware framework that addresses ubiquitous problems of data movement in complex memory hierarchies and at many levels of the HPC software stack.
Though HPC and HPDA applications pose a broad variety of efficiency challenges, it would be fair to say that the performance of both has become dominated by data movement through the memory and storage systems, as opposed to floating point computational capability. Despite this shift, current software technologies remain severely limited in their ability to optimise data movement. The Maestro project addresses what it sees as the two major impediments of modern HPC software:
1. Moving data through memory was not always the bottleneck. The software stack that HPC relies upon was built through decades of a different situation – when the cost of performing floating point operations (FLOPS) was paramount. Several decades of technical evolution built a software stack and programming models highly fit for optimising floating point operations but lacking in basic data handling functionality. We characterise the set of technical issues at missing data-awareness.
2. Software rightfully insulates users from hardware details, especially as we move higher up the software stack. But HPC applications, programming environments and systems software cannot make key data movement decisions without some understanding of the hardware, especially the increasingly complex memory hierarchy. With the exception of runtimes, which treat memory in a domain-specific manner, software typically must make hardware-neutral decisions which can often leave performance on the table . We characterise this issue as missing memory-awareness.
Maestro proposes a middleware framework that enables memory- and data-awareness.
Champ scientifique
Programme(s)
Régime de financement
RIA - Research and Innovation actionCoordinateur
52428 Julich
Allemagne