Descrizione del progetto
Applicare metodi analitici estremi nella sanità
I volumi su esascala relativi a diversi dati sanitari si distinguono per dimensione (la produzione del 2020 ha superato 2 000 exabyte), eterogeneità (numerosi supporti e metodi di acquisizione), conoscenze (referti diagnostici) e valore commerciale. La natura supervisionata di modelli di apprendimento profondo richiede numerosi dati marcati e annotati, e impedisce che i modelli estraggano conoscenze e valore. L’obiettivo del progetto EXA MODE, finanziato dall’UE, è quello di consentire un’estrazione di conoscenze semplice, rapida e debolmente supervisionata dei dati eterogenei su esascala, limitando l’interazione umana. Gli obiettivi del progetto comprendono lo sviluppo e il rilascio di nuovi metodi e strumenti di analisi su larghissima scala per previsioni precise, sostenendo il processo decisionale del settore e degli ospedali. Il middleware semantico multimodale offrirà una gestione e un’analisi più semplici e più rapide di dati eterogenei, migliorando le architetture di sistemi distribuiti complessi e aumentando la velocità del volume di produzione e di accesso dei dati.
Obiettivo
Exascale volumes of diverse data from distributed sources are continuously produced. Healthcare data stand out in the size produced (production 2020 >2000 exabytes), heterogeneity (many media, acquisition methods), included knowledge (e.g. diagnostic reports) and commercial value. The supervised nature of deep learning models requires large labeled, annotated data, which precludes models to extract knowledge and value. EXA MODE solves this by allowing easy & fast, weakly supervised knowledge discovery of exascale heterogeneous data provided by the partners, limiting human interaction. Its objectives include the development and release of extreme analytic methods and tools, that are adopted in decision making by industry and hospitals. Deep learning naturally allows to build semantic representations of entities and relations in multimodal data. Knowledge discovery is performed via document-level semantic networks in text and the extraction of homogeneous features in heterogeneous images. The results are fused, aligned to medical ontologies, visualized and refined. Knowledge is then applied using a semantic middleware to compress, segment and classify images and it is exploited in decision support and semantic knowledge management prototypes. EXA MODE is relevant to ICT12 in several aspects: 1) Challenge: it extracts knowledge and value from heterogeneous quickly increasing data volumes. 2) Scope: the consortium develops and releases new methods and concepts for extreme scale analytics to accelerate deep analysis also via data compression, for precise predictions, support decision making and visualize multi-modal knowledge. 3) Impact: the multi-modal/media semantic middleware makes heterogeneous data management & analysis easier & faster, it improves architectures for complex distributed systems with better tools increasing speed of data throughput and access, as resulting from tests in extreme analysis by industry and in hospitals.
Campo scientifico
Parole chiave
Programma(i)
Meccanismo di finanziamento
RIA - Research and Innovation actionCoordinatore
2800 Delemont
Svizzera