Descripción del proyecto
Un método de aprendizaje automático para determinar las normas de la transdiferenciación celular
La identidad celular viene determinada por la expresión específica según el tipo de célula de los factores de transcripción (FT), mientras que el panorama epigenético de la célula se mantiene a través de proteínas reguladoras epigenéticas (RE). Cada vez más pruebas sugieren una cooperación de múltiples FT y RE a la hora de establecer el espectro de los distintos tipos de células y estados celulares en el cuerpo humano. El proyecto financiado con fondos europeos SingleCellAI está desarrollando un método de aprendizaje automático para la predicción «in silico» de cócteles FT/RE que puedan reprogramar cualquier tipo de célula para que se convierta en otro tipo de célula, mediante la creación de un algoritmo de transdiferenciación celular. El estudio entrenará a un modelo de aprendizaje automático con conjuntos de datos de secuenciación de células únicas editadas con CRISPR a gran escala. Este método basado en datos se validará experimentalmente en el contexto del sistema hematopoyético humano.
Objetivo
Cellular identity is controlled by cell type specific expression of transcription factors (TFs), and it is reflected in the cell’s epigenetic landscape maintained by epigenetic regulator proteins (ERs). Functional dissection of cellular identity has focused mainly on a small number of lineage-defining master regulators, yet there is increasing evidence that multiple TFs and ERs work together to establish and retain the vast number of different cell types and cell states in the human body. For a more quantitative understanding of cellular identity, and of the complexities of its regulation, I propose to develop a machine-learning approach for in silico prediction of TF/ER cocktails that can transdifferentiate any human cell type into any other cell type, thus defining an operational rulebook of cellular transdifferentiation. To this end, I will train a machine-learning model called generative adversarial networks (GANs) on large-scale CRISPR single-cell sequencing (CROP-seq) datasets generated in the host lab. Exploiting unique features of the deep-learning generative approach, the resulting model will be able to generalize the learned genetic perturbations across cell types in silico. I will experimentally validate several of these predicted TF/ER transdifferentiation cocktails in the context of the human hematopoietic system. Importantly, the proposed approach is hypothesis-free and data-driven, exploiting recent advances in machine learning to infer fundamental aspects of the regulation of cellular identity from high-throughput functional CRISPR single-cell sequencing data.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
- ciencias naturalesciencias biológicasbioquímicabiomoléculasproteínas
- ciencias naturalesinformática y ciencias de la informacióninteligencia artificialinteligencia artificial generativa
- ciencias naturalesinformática y ciencias de la informacióninteligencia artificialaprendizaje automáticoaprendizaje profundo
Para utilizar esta función, debe iniciar sesión o registrarse
Programa(s)
Régimen de financiación
MSCA-IF-EF-ST - Standard EFCoordinador
1090 Wien
Austria