Skip to main content
European Commission logo
español español
CORDIS - Resultados de investigaciones de la UE
CORDIS

REliable power and time-ConstraInts-aware Predictive management of heterogeneous Exascale systems

Descripción del proyecto

«Software» y «hardware» para llevar la informática de alto rendimiento a nuevos niveles

Antes de alcanzar la exaescala, las instalaciones de informática de alto rendimiento (HPC, por sus siglas en inglés) deben superar varios obstáculos. Entre ellos, la complejidad de las infraestructuras de HPC a exaescala, la fiabilidad y los fallos. Para superar estos retos, los superordenadores tendrán que ser potentes y eficientes energéticamente. El equipo del proyecto RECIPE, financiado con fondos europeos, pretende crear una infraestructura jerárquica de gestión de recursos en tiempo de ejecución para optimizar la eficiencia energética y minimizar la aparición de puntos calientes térmicos. También introducirá una metodología de fiabilidad predictiva para respaldar la calidad del servicio, independientemente de los fallos de «hardware» transitorios y a largo plazo. Por último, en el proyecto se proporcionará un conjunto de capas de integración que permitan a los gestores de recursos interactuar con la aplicación y la arquitectura subyacente.

Objetivo

The current HPC facilities will need to grow by an order of magnitude in the next few years to reach the Exascale range. The dedicated middleware needed to manage the enormous complexity of future HPC centers, where deep heterogeneity is needed to handle the wide variety of applications within reasonable power budgets, will be one of the most critical aspects in the evolution of HPC infrastructure towards Exascale. This middleware will need to address the critical issue of reliability in face of the increasing number of resources, and therefore decreasing mean time between failures.
To close this gap, RECIPE provides: a hierarchical runtime resource management infrastructure optimizing energy efficiency and ensuring reliability for both time-critical and throughput-oriented computation; a predictive reliability methodology to support the enforcing of QoS guarantees in face of both transient and long-term hardware failures, including thermal, timing and reliability models; and a set of integration layers allowing the resource manager to interact with both the application and the underlying deeply heterogeneous architecture, addressing them in a disaggregate way.
Quantitative goals for RECIPE include: 25% increase in energy efficiency (performance/watt) with an 15% MTTF improvement due to proactive thermal management; energy-delay product improved up to 25%; 20% reduction of faulty executions.
The project will assess its results against the following set of real world use cases, addressing key application domains ranging from well established HPC applications such as geophysical exploration and meteorology, to emerging application domains such as biomedical machine learning and data analytics.
To this end, RECIPE relies on a consortium composed of four leading academic partners (POLIMI,UPV,EPFL,CeRICT); two supercomputing centers, BSC and PSNC; a research hospital, CHUV, and an SME, IBTS, which provide effective exploitation avenues through industry-based use cases

Convocatoria de propuestas

H2020-FETHPC-2016-2017

Consulte otros proyectos de esta convocatoria

Convocatoria de subcontratación

H2020-FETHPC-2017

Régimen de financiación

RIA - Research and Innovation action

Coordinador

POLITECNICO DI MILANO
Aportación neta de la UEn
€ 705 000,00
Dirección
PIAZZA LEONARDO DA VINCI 32
20133 Milano
Italia

Ver en el mapa

Región
Nord-Ovest Lombardia Milano
Tipo de actividad
Higher or Secondary Education Establishments
Enlaces
Coste total
€ 705 750,00

Participantes (7)