Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français français
CORDIS - Résultats de la recherche de l’UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Computational genomics of long noncoding RNA domains across metazoans

Description du projet

ARN non‑codants longs: associer la fonction à la séquence

La découverte des gènes des ARN non‑codants longs (ARNlnc) a révolutionné la science du génome et incité les scientifiques à repenser l’ADN poubelle. De nouvelles preuves indiquent que les ARNlnc sont impliqués dans le développement et les maladies et devraient donc être étudiés plus en détail. Le projet RNADOMAIN, financé par l’UE, étudiera comment la fonction des ARNlnc est codée dans la séquence primaire de l’ARN. Grâce à une approche computationnelle à haut débit, les chercheurs identifieront et associeront les domaines des ARNlnc à leur localisation et à leur fonction biologique. En outre, des algorithmes d’apprentissage automatique permettront de prédire de nouveaux domaines fonctionnels des ARNlnc et de mettre en lumière le rôle de ces molécules nouvellement découvertes dans la santé et la maladie.

Objectif

From junk DNA to genomic dark matter, the road to understanding RNAs that do not encode for proteins has been full of surprises. Compared to 19,000 protein-coding genes, recent estimates point that our genome contains between 25,000 and 100,000 long noncoding RNA (lncRNA) genes. Far from being inert, some lncRNAs are involved in development and disease, particularly, cancer. It has also been shown that the function of a lncRNA can be associated with its localisation in subcellular compartments. Nevertheless, to experimentally characterize and validate interesting lncRNAs is an arduous task. Computational approaches based on machine learning could be designed to complement and scale-up such efforts. Based on recent experimental discoveries, it has been proposed that lncRNAs are separable into functional domains, and that these domains are intimately related to transposable elements and repeats. Nevertheless, how functions are encoded in primary RNA sequence is a fundamental unsolved problem. I propose to develop the first high-throughput computational approach to map lncRNA domains across metazoan genomes. Domains will be first identified according to statistical evidence supported by current biological insights. Putative domains will be queried against state-of-the-art databases on lncRNA function, localisation, and disease. Machine learning algorithms will then be employed to predict new functional domains, and new mechanistic insights will be offered for promising candidates. Lastly, the obtained maps will be stored and disseminated in a database, that will be regularly updated and readily accessible for the research community. This will be a foundational resource to finally shed light on the role of lncRNAs, their regulation and involvement in disease.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: https://op.europa.eu/en/web/eu-vocabularies/euroscivoc.

Vous devez vous identifier ou vous inscrire pour utiliser cette fonction

Coordinateur

UNIVERSITY COLLEGE DUBLIN, NATIONAL UNIVERSITY OF IRELAND, DUBLIN
Contribution nette de l'UE
€ 196 590,72
Coût total
€ 196 590,72

Participants (1)