Description du projet
Étudier les caractéristiques fonctionnelles des protéines de liaison de l’ARN grâce à un modèle d’apprentissage automatique
Les protéines de liaison à l’ARN ou RBP (RNA-binding proteins) régulent l’expression des gènes dans la mesure où elles sont capables de reconnaître des centaines de transcrits et de former des réseaux de régulation pour maintenir l’homéostasie cellulaire. Or les cribles globaux de RBP ont conduit à identifier des centaines de protéines sans domaines de liaison à l’ARN discernables. Ces protéines, appelées enigmRBP, se lient à l’ARN de manière inconnue et variable. Le projet DEEPLEARNRBP, financé par l’UE, vise à développer un modèle d’apprentissage automatique pour explorer les implications fonctionnelles des caractéristiques de liaison des RBP. Le projet se concentrera sur l’interprétation pratique d’un modèle d’apprentissage machine appliqué à la connaissance biologique, et en particulier sur l’apprentissage de l’interaction entre les divers intrants de la structure secondaire, de la séquence et de la conservation.
Objectif
New technologies have revolutionized our understanding of RNA binding protein (RBP) function. Global screens for RBPs have pulled down hundreds of proteins for which no discernable RNA Binding Domain is present. These proteins, termed enigmRBPs due to their enigmatic nature, do bind RNA in unknown and variable fashion. An ever increasing number of such RBPs are having their target sites identified via CrossLinking and ImmunoPrecipitation Sequencing techniques (CLIP-Seq). This torrent of data can be harnessed by novel Deep Learning techniques to identify high order characteristics of RBP function.
The aim of this proposal is the development of a machine learning model that can explore the functional implications of RBP binding characteristics. A model that, given an enigmatic RBP, can identify other known RBPs that show similar binding characteristics, such as sequence motifs, conservation motifs, secondary structure motifs, and higher order combinations of the above.
We will focus on methods to practically interpret the machine learning model to biological knowledge, especially higher order filters that can learn the interplay among varied input, such as secondary structure, sequence and conservation. Beyond the theoretical, we will disseminate our methods in easy to use, standalone and web application format, in order to increase the practical application of our research.
We are transplanting expertise from the bioinformatics and machine learning field, into a fertile substrate of RNA biology and CLIP-Seq experimentation. This interdisciplinary project will involve close collaboration and two-way transfer of knowledge in a dynamic research environment.
Champ scientifique (EuroSciVoc)
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.
- sciences naturellessciences biologiquesbiochimiebiomoléculeprotéines
- sciences naturellesinformatique et science de l'informationintelligence artificielleapprentissage automatiqueapprentissage profond
- sciences naturellessciences biologiquesgénétiqueARN
Vous devez vous identifier ou vous inscrire pour utiliser cette fonction
Programme(s)
Thème(s)
Appel à propositions
(s’ouvre dans une nouvelle fenêtre) H2020-WF-2018-2020
Voir d’autres projets de cet appelSous appel
H2020-WF-01-2018
Régime de financement
MSCA-IF-EF-RI - RI – Reintegration panelCoordinateur
601 77 Brno
Tchéquie