Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Using Deep Learning to understand RNA Binding Protein binding characteristics

Description du projet

Étudier les caractéristiques fonctionnelles des protéines de liaison de l’ARN grâce à un modèle d’apprentissage automatique

Les protéines de liaison à l’ARN ou RBP (RNA-binding proteins) régulent l’expression des gènes dans la mesure où elles sont capables de reconnaître des centaines de transcrits et de former des réseaux de régulation pour maintenir l’homéostasie cellulaire. Or les cribles globaux de RBP ont conduit à identifier des centaines de protéines sans domaines de liaison à l’ARN discernables. Ces protéines, appelées enigmRBP, se lient à l’ARN de manière inconnue et variable. Le projet DEEPLEARNRBP, financé par l’UE, vise à développer un modèle d’apprentissage automatique pour explorer les implications fonctionnelles des caractéristiques de liaison des RBP. Le projet se concentrera sur l’interprétation pratique d’un modèle d’apprentissage machine appliqué à la connaissance biologique, et en particulier sur l’apprentissage de l’interaction entre les divers intrants de la structure secondaire, de la séquence et de la conservation.

Objectif

New technologies have revolutionized our understanding of RNA binding protein (RBP) function. Global screens for RBPs have pulled down hundreds of proteins for which no discernable RNA Binding Domain is present. These proteins, termed enigmRBPs due to their enigmatic nature, do bind RNA in unknown and variable fashion. An ever increasing number of such RBPs are having their target sites identified via CrossLinking and ImmunoPrecipitation Sequencing techniques (CLIP-Seq). This torrent of data can be harnessed by novel Deep Learning techniques to identify high order characteristics of RBP function.

The aim of this proposal is the development of a machine learning model that can explore the functional implications of RBP binding characteristics. A model that, given an enigmatic RBP, can identify other known RBPs that show similar binding characteristics, such as sequence motifs, conservation motifs, secondary structure motifs, and higher order combinations of the above.

We will focus on methods to practically interpret the machine learning model to biological knowledge, especially higher order filters that can learn the interplay among varied input, such as secondary structure, sequence and conservation. Beyond the theoretical, we will disseminate our methods in easy to use, standalone and web application format, in order to increase the practical application of our research.

We are transplanting expertise from the bioinformatics and machine learning field, into a fertile substrate of RNA biology and CLIP-Seq experimentation. This interdisciplinary project will involve close collaboration and two-way transfer of knowledge in a dynamic research environment.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Coordinateur

Masarykova univerzita
Contribution nette de l'UE
€ 156 980,64
Adresse
Zerotinovo namesti 9
601 77 Brno
Tchéquie

Voir sur la carte

Région
Česko Jihovýchod Jihomoravský kraj
Type d’activité
Higher or Secondary Education Establishments
Liens
Coût total
€ 156 980,64