Descrizione del progetto
Una generazione di dati sintetici basata sull’IA tramite apprendimento federato per colmare le lacune nei dati relativi alle malattie ematologiche
La drepanocitosi e la leucemia mieloide acuta sono due delle numerose malattie ematologiche esistenti, condizioni di rara diffusione che risultano tuttavia costose e debilitanti. Gli attuali metodi per il loro trattamento sono spesso inefficaci, in particolare per quanto riguarda le patologie più rare. Il numero di pazienti relativamente basso per malattia comporta una quantità scarsa di dati frammentati, il che rende difficile lo svolgimento di attività di ricerca e sviluppo. Il progetto SYNTHEMA, finanziato dall’UE, istituirà un data hub transfrontaliero allo scopo di sviluppare e convalidare tecniche innovative basate sull’IA per l’anonimizzazione di dati clinici, immaginografici e omici, nonché per la generazione di dati sintetici. L’infrastruttura di apprendimento federato (che integra addestramento di algoritmi distribuiti, computazione pluripartitica sicura e privacy differenziale) sarà impiegata per addestrare gli algoritmi di IA sviluppati ed effettuare un’aggregazione globale di modelli basata su computazione pluripartitica sicura in una modalità in grado di tutelare la privacy.
Obiettivo
Haematological diseases (HDs) are a large group of disorders resulting from quantitative or qualitative abnormalities of blood cells, lymphoid organs and coagulation factors. Despite most of them (~74%) are rare, the overall number of HD affected patients worldwide is important, placing a considerable economic burden on healthcare systems and societies. Despite the existence of several collaborative research groups at national and EU level, current clinical approaches are often ineffective, particularly for rarest conditions, due to the relatively low number of patients per disease and the high number of unconnected clinical entities.
SYNTHEMA aims to establish a cross-border data hub where to develop and validate innovative AI-based techniques for clinical data anonymisation and synthetic data generation (SDG), to tackle the scarcity and fragmentation of data and widen the basis for GDPR-compliant research in RHDs. The project will focus on two representative RHD use cases: sickle-cell disease (SCD) and acute myeloid leukaemia (AML).
SYNTHEMA will develop a federated learning (FL) infrastructure, equipped with secure multiparty computation (SMPC) and differential privacy (DF) protocols, connecting clinical centres bringing standardised, interoperable multimodal datasets and computing centres from academia and SME. This framework will be utilised to train the developed algorithms and perform SMPC-based global model aggregation in a privacy-preserving fashion. The resulting data will be validated for their clinical value, statistical utility and residual privacy risks. The project will develop legal and ethical frameworks to guarantee privacy by-design in the collection and processing of health-related personal data and attain an ethics-wise algorithm co-creation. Project outcomes, including pipelines, standards and data, will be made openly available to stakeholders in the healthcare, academia and industry field, and contribute to existing rare disease registries
Campo scientifico (EuroSciVoc)
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
È necessario effettuare l’accesso o registrarsi per utilizzare questa funzione
Programma(i)
Invito a presentare proposte
(si apre in una nuova finestra) HORIZON-HLTH-2022-IND-13
Vedi altri progetti per questo bandoMeccanismo di finanziamento
HORIZON-RIA - HORIZON Research and Innovation ActionsCoordinatore
28040 Madrid
Spagna