Descrizione del progetto
Codificare o non codificare, questo è il dilemma evolutivo
L’espressione di un gene (la produzione della proteina corrispondente) richiede la trascrizione e la traduzione. Durante la trascrizione, l’informazione nel DNA viene trasferita a una molecola di RNA messaggero (mRNA). Durante la traduzione, la sequenza di mRNA viene usata per assemblare gli aminoacidi che formano la proteina. In alcuni geni, non tutta la sequenza di DNA codifica la proteina. Questi introni vengono rimossi nello splicing dopo la trascrizione, lasciando solo gli esoni nella molecola di RNA matura per produrre la proteina. Lo splicing è fondamentale per l’evoluzione della sequenza ma il meccanismo di fondo non è chiaro. EvolSpliceKinetics sta conducendo il primo studio dell’intero genoma sulla definizione di esone e introne. Il sequenziamento d’avanguardia in un organismo modello in combinazione con l’apprendimento automatico e la genetica della popolazione dovrebbe fornire informazioni senza precedenti sul ruolo evolutivo della cinetica del processo di splicing.
Obiettivo
The need to preserve correct splicing is a major source of constraint on sequence evolution. This includes selection on the splice sites as well as on regulatory elements in exons and introns. Are all exons and introns constrained similarly by splicing related pressures? This is a crucial problem not only for understanding genome evolution but also for predicting where disease-causing mutations occur.
Any variation in the prevalence of splicing information most likely reflects mechanistic variation in how the splicing process unfolds at different introns. Notably, it is often assumed that the relative importance of intronic and exonic splicing information depends on whether the splicing machinery recognizes introns or exons as the initial unit. However, this common model has never been tested directly because it is currently not possible to investigate splicing mechanism at this level of detail genome-wide. Existing studies on the distribution of splicing information are therefore based on proxies of unclear mechanistic significance, such as intron size.
My host lab has developed a nascent RNA sequencing technique that allows unprecedented insight into splicing dynamics transcriptome-wide. They have recently applied this method to Drosophila melanogaster, a species thought to use a diversity of splicing strategies. I propose to use this data, combined with a machine learning approach, to conduct the first genome-wide study into exon and intron definition based on direct kinetic evidence. I will then use population genetics methods to determine how the prevalence and strength of selection on different types of splicing information covaries with splicing dynamics.
Campo scientifico
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP.
Programma(i)
Argomento(i)
Meccanismo di finanziamento
MSCA-IF - Marie Skłodowska-Curie Individual Fellowships (IF)Coordinatore
1649 028 Lisboa
Portogallo