Descripción del proyecto
Estudio de las características funcionales de las proteínas de unión a ARN mediante un modelo de aprendizaje automático
Las proteínas de unión a ARN (RBP, por sus siglas en inglés) regulan la expresión génica, ya que pueden reconocer cientos de transcritos y crear redes de regulación para mantener la homeostasis celular. Los cribados globales de RBP han permitido identificar cientos de proteínas sin dominios de unión a ARN discernibles. Estas proteínas, denominadas «enigmRBP», se unen al ARN de una forma desconocida y variable. El objetivo del proyecto financiado con fondos europeos DEEPLEARNRBP es desarrollar un modelo de aprendizaje automático para examinar las repercusiones funcionales de las características de unión de las RBP. El proyecto se centrará en la interpretación práctica del modelo de aprendizaje automático para el conocimiento biológico, en concreto en el aprendizaje de la interacción entre diversas fuentes de información de estructura secundaria, secuencia y conservación.
Objetivo
New technologies have revolutionized our understanding of RNA binding protein (RBP) function. Global screens for RBPs have pulled down hundreds of proteins for which no discernable RNA Binding Domain is present. These proteins, termed enigmRBPs due to their enigmatic nature, do bind RNA in unknown and variable fashion. An ever increasing number of such RBPs are having their target sites identified via CrossLinking and ImmunoPrecipitation Sequencing techniques (CLIP-Seq). This torrent of data can be harnessed by novel Deep Learning techniques to identify high order characteristics of RBP function.
The aim of this proposal is the development of a machine learning model that can explore the functional implications of RBP binding characteristics. A model that, given an enigmatic RBP, can identify other known RBPs that show similar binding characteristics, such as sequence motifs, conservation motifs, secondary structure motifs, and higher order combinations of the above.
We will focus on methods to practically interpret the machine learning model to biological knowledge, especially higher order filters that can learn the interplay among varied input, such as secondary structure, sequence and conservation. Beyond the theoretical, we will disseminate our methods in easy to use, standalone and web application format, in order to increase the practical application of our research.
We are transplanting expertise from the bioinformatics and machine learning field, into a fertile substrate of RNA biology and CLIP-Seq experimentation. This interdisciplinary project will involve close collaboration and two-way transfer of knowledge in a dynamic research environment.
Ámbito científico (EuroSciVoc)
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
CORDIS clasifica los proyectos con EuroSciVoc, una taxonomía plurilingüe de ámbitos científicos, mediante un proceso semiautomático basado en técnicas de procesamiento del lenguaje natural.
- ciencias naturalesciencias biológicasbioquímicabiomoléculasproteínas
- ciencias naturalesinformática y ciencias de la informacióninteligencia artificialaprendizaje automáticoaprendizaje profundo
- ciencias naturalesciencias biológicasgenéticaARN
Para utilizar esta función, debe iniciar sesión o registrarse
Programa(s)
Convocatoria de propuestas
Consulte otros proyectos de esta convocatoriaConvocatoria de subcontratación
H2020-WF-01-2018
Régimen de financiación
MSCA-IF-EF-RI - RI – Reintegration panelCoordinador
601 77 Brno
Chequia