Descrizione del progetto
Migliorare la scalabilità degli algoritmi a grafo per la bioinformatica
I progressi nelle tecnologie di sequenziamento, come la mappatura del genoma umano, hanno aperto la strada a scoperte rivoluzionarie. Tuttavia, con la crescita dei volumi di dati, è necessario disporre di metodi di calcolo affidabili. Il progetto SCALEBIO, finanziato dal CER, intende migliorare la scalabilità degli algoritmi esatti a grafo attraverso strutture innovative di preelaborazione dei grafi e moderne tecniche algoritmiche. In particolare, verranno introdotte strutture di sicurezza per semplificare la risoluzione dei problemi identificando percorsi comuni nelle soluzioni ottimali, insieme a strutture di variazione che si concentrano su aree con variazioni genetiche significative. Le metodologie chiave includeranno algoritmi polinomiali parametrizzati e algoritmi dinamici in grado di adattarsi a nuovi dati. Queste tecniche saranno applicate a settori quali la scoperta di trascritti di RNA a lettura lunga e l’indicizzazione di grandi banche dati genetiche.
Obiettivo
Sequencing technologies have developed to be cheap and accurate, leading to major breakthroughs, such as the complete sequence of a human genome, the creation of nationwide population gene banks, or the discovery of novel viruses. As the amount of data produced grows exponentially and their applications become more broad and complex, the community needs accurate computational methods that scale.
At the core of many algorithmic methods for processing sequencing data is the basic primitive of finding a set of paths or walks in graphs of various nature. Under different formulations and objective functions, the resulting problems can be NP-hard (e.g. flow decompositions) or polynomial-time (e.g. path covers), which are impractical on large graphs. Thus, many practical tools prefer fast heuristics to exact algorithms. While these may be optimized for specific inputs, they may not be reliable or accurate in general, which is a highly relevant issue in e.g. medical and life-science research.
This project will develop general methods to massively scale such exact graph algorithms. First, via novel graph structures usable in a preprocessing step: safety structures, e.g. sets of paths that can be quickly found to appear in all optimal solutions and thus simplify the problem; variation structures that limit the hardness of a problem only to graph areas rich in genetic variation. Second, via modern algorithmic techniques: parameterizing polynomial algorithms to run in time linear in the graph size and superlinear only in a small parameter; dynamic algorithms that, as the input grows, update solutions based only on the new data.
We will apply these methods in two high-impact applications: long-read RNA transcript discovery, and indexing massive and rapidly growing genomic databases.
This project paves the way for exact graph algorithms usable independently of the problem complexity or of the input size, applicable to real-world problems.
Campo scientifico (EuroSciVoc)
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.
La classificazione di questo progetto è stata convalidata da un essere umano.
CORDIS classifica i progetti con EuroSciVoc, una tassonomia multilingue dei campi scientifici, attraverso un processo semi-automatico basato su tecniche NLP. Cfr.: Il Vocabolario Scientifico Europeo.
La classificazione di questo progetto è stata convalidata da un essere umano.
- scienze naturali informatica e scienze dell'informazione basi di dati
- scienze naturali scienze biologiche microbiologia virologia
- scienze naturali scienze biologiche genetica genomi
- scienze naturali informatica e scienze dell'informazione intelligenza artificiale programmazione euristica
- scienze naturali matematica matematica pura matematica discreta
Programma(i)
Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.
Programmi di finanziamento pluriennali che definiscono le priorità dell’UE in materia di ricerca e innovazione.
-
HORIZON.1.1 - European Research Council (ERC)
PROGRAMMA PRINCIPALE
Vedi tutti i progetti finanziati nell’ambito di questo programma
Argomento(i)
Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.
Gli inviti a presentare proposte sono suddivisi per argomenti. Un argomento definisce un’area o un tema specifico per il quale i candidati possono presentare proposte. La descrizione di un argomento comprende il suo ambito specifico e l’impatto previsto del progetto finanziato.
Meccanismo di finanziamento
Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.
Meccanismo di finanziamento (o «Tipo di azione») all’interno di un programma con caratteristiche comuni. Specifica: l’ambito di ciò che viene finanziato; il tasso di rimborso; i criteri di valutazione specifici per qualificarsi per il finanziamento; l’uso di forme semplificate di costi come gli importi forfettari.
HORIZON-ERC - HORIZON ERC Grants
Vedi tutti i progetti finanziati nell’ambito di questo schema di finanziamento
Invito a presentare proposte
Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.
Procedura per invitare i candidati a presentare proposte di progetti, con l’obiettivo di ricevere finanziamenti dall’UE.
(si apre in una nuova finestra) ERC-2024-COG
Vedi tutti i progetti finanziati nell’ambito del bandoIstituzione ospitante
Contributo finanziario netto dell’UE. La somma di denaro che il partecipante riceve, decurtata dal contributo dell’UE alla terza parte collegata. Tiene conto della distribuzione del contributo finanziario dell’UE tra i beneficiari diretti del progetto e altri tipi di partecipanti, come i partecipanti terzi.
00014 HELSINGIN YLIOPISTO
Finlandia
I costi totali sostenuti dall’organizzazione per partecipare al progetto, compresi i costi diretti e indiretti. Questo importo è un sottoinsieme del bilancio complessivo del progetto.