Skip to main content
European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary

Computational genomics of long noncoding RNA domains across metazoans

Opis projektu

Długie niekodujące RNA: wiązanie funkcji z sekwencją

Odkrycie genów długich niekodujących RNA (lncRNA) zrewolucjonizowało naukę genomową i pomogło naukowcom ponownie poznać niekodujące DNA. Nowe dowody wskazują na to, że lncRNA biorą udział w rozwoju i procesach chorobowych, dlatego powinny zostać dokładnie zbadane. Zespół finansowanego przez UE projektu RNADOMAIN zbada, jak funkcja lncRNA jest zakodowana w pierwotnej sekwencji RNA. Wykorzystując wysokowydajne podejście obliczeniowe, naukowcy rozpoznają i powiążą domeny lncRNA z lokalizacją i funkcją biologiczną. Ponadto algorytmy uczenia maszynowego pomogą w przewidywaniu nowych funkcjonalnych domen lncRNA i dostarczą informacji na temat roli tych nowo odkrytych cząsteczek w utrzymaniu zdrowia i procesach chorobowych.

Cel

From junk DNA to genomic dark matter, the road to understanding RNAs that do not encode for proteins has been full of surprises. Compared to 19,000 protein-coding genes, recent estimates point that our genome contains between 25,000 and 100,000 long noncoding RNA (lncRNA) genes. Far from being inert, some lncRNAs are involved in development and disease, particularly, cancer. It has also been shown that the function of a lncRNA can be associated with its localisation in subcellular compartments. Nevertheless, to experimentally characterize and validate interesting lncRNAs is an arduous task. Computational approaches based on machine learning could be designed to complement and scale-up such efforts. Based on recent experimental discoveries, it has been proposed that lncRNAs are separable into functional domains, and that these domains are intimately related to transposable elements and repeats. Nevertheless, how functions are encoded in primary RNA sequence is a fundamental unsolved problem. I propose to develop the first high-throughput computational approach to map lncRNA domains across metazoan genomes. Domains will be first identified according to statistical evidence supported by current biological insights. Putative domains will be queried against state-of-the-art databases on lncRNA function, localisation, and disease. Machine learning algorithms will then be employed to predict new functional domains, and new mechanistic insights will be offered for promising candidates. Lastly, the obtained maps will be stored and disseminated in a database, that will be regularly updated and readily accessible for the research community. This will be a foundational resource to finally shed light on the role of lncRNAs, their regulation and involvement in disease.

Dziedzina nauki (EuroSciVoc)

Klasyfikacja projektów w serwisie CORDIS opiera się na wielojęzycznej taksonomii EuroSciVoc, obejmującej wszystkie dziedziny nauki, w oparciu o półautomatyczny proces bazujący na technikach przetwarzania języka naturalnego.

Aby użyć tej funkcji, musisz się zalogować lub zarejestrować

Koordynator

UNIVERSITY COLLEGE DUBLIN, NATIONAL UNIVERSITY OF IRELAND, DUBLIN
Wkład UE netto
€ 196 590,72
Adres
BELFIELD
4 Dublin
Irlandia

Zobacz na mapie

Region
Ireland Eastern and Midland Dublin
Rodzaj działalności
Higher or Secondary Education Establishments
Linki
Koszt całkowity
€ 196 590,72

Uczestnicy (1)