Skip to main content
Aller à la page d’accueil de la Commission européenne (s’ouvre dans une nouvelle fenêtre)
français fr
CORDIS - Résultats de la recherche de l’UE
CORDIS

Scalable Graph Algorithms for Bioinformatics using Structure, Parameterization and Dynamic Updates

Description du projet

Améliorer la modularité des algorithmes de graphes pour la bio-informatique

Les progrès des technologies de séquençage, telles que la cartographie du génome humain, ont mené à des découvertes révolutionnaires. Cependant, à mesure que les volumes de données augmentent, il est important de disposer de méthodes de calcul fiables. Le projet SCALEBIO, financé par le CER, entend améliorer l’extensibilité des algorithmes de graphes exacts par le biais de structures de graphes de prétraitement innovantes et de techniques algorithmiques modernes. Plus précisément, il proposera des structures de sécurité qui simplifieront la résolution des problèmes en identifiant les chemins communs dans les solutions optimales, ainsi que des structures de variation dans des domaines présentant une variation génétique significative. Ces méthodologies consisteront notamment en des algorithmes polynomiaux paramétrés et des algorithmes dynamiques capables de s’adapter à de nouvelles données. Ces techniques seront appliquées à des domaines tels que la découverte de transcriptions d’ARN à lecture longue et l’indexation de vastes bases de données génétiques.

Objectif

Sequencing technologies have developed to be cheap and accurate, leading to major breakthroughs, such as the complete sequence of a human genome, the creation of nationwide population gene banks, or the discovery of novel viruses. As the amount of data produced grows exponentially and their applications become more broad and complex, the community needs accurate computational methods that scale.

At the core of many algorithmic methods for processing sequencing data is the basic primitive of finding a set of paths or walks in graphs of various nature. Under different formulations and objective functions, the resulting problems can be NP-hard (e.g. flow decompositions) or polynomial-time (e.g. path covers), which are impractical on large graphs. Thus, many practical tools prefer fast heuristics to exact algorithms. While these may be optimized for specific inputs, they may not be reliable or accurate in general, which is a highly relevant issue in e.g. medical and life-science research.

This project will develop general methods to massively scale such exact graph algorithms. First, via novel graph structures usable in a preprocessing step: safety structures, e.g. sets of paths that can be quickly found to appear in all optimal solutions and thus simplify the problem; variation structures that limit the hardness of a problem only to graph areas rich in genetic variation. Second, via modern algorithmic techniques: parameterizing polynomial algorithms to run in time linear in the graph size and superlinear only in a small parameter; dynamic algorithms that, as the input grows, update solutions based only on the new data.

We will apply these methods in two high-impact applications: long-read RNA transcript discovery, and indexing massive and rapidly growing genomic databases.

This project paves the way for exact graph algorithms usable independently of the problem complexity or of the input size, applicable to real-world problems.

Champ scientifique (EuroSciVoc)

CORDIS classe les projets avec EuroSciVoc, une taxonomie multilingue des domaines scientifiques, grâce à un processus semi-automatique basé sur des techniques TLN. Voir: Le vocabulaire scientifique européen.
La classification de ce projet a été validée par des humains.

Programme(s)

Programmes de financement pluriannuels qui définissent les priorités de l’UE en matière de recherche et d’innovation.

Thème(s)

Les appels à propositions sont divisés en thèmes. Un thème définit un sujet ou un domaine spécifique dans le cadre duquel les candidats peuvent soumettre des propositions. La description d’un thème comprend sa portée spécifique et l’impact attendu du projet financé.

Régime de financement

Régime de financement (ou «type d’action») à l’intérieur d’un programme présentant des caractéristiques communes. Le régime de financement précise le champ d’application de ce qui est financé, le taux de remboursement, les critères d’évaluation spécifiques pour bénéficier du financement et les formes simplifiées de couverture des coûts, telles que les montants forfaitaires.

HORIZON-ERC - HORIZON ERC Grants

Voir tous les projets financés dans le cadre de ce programme de financement

Appel à propositions

Procédure par laquelle les candidats sont invités à soumettre des propositions de projet en vue de bénéficier d’un financement de l’UE.

(s’ouvre dans une nouvelle fenêtre) ERC-2024-COG

Voir tous les projets financés au titre de cet appel

Institution d’accueil

HELSINGIN YLIOPISTO
Contribution nette de l'UE

La contribution financière nette de l’UE est la somme d’argent que le participant reçoit, déduite de la contribution de l’UE versée à son tiers lié. Elle prend en compte la répartition de la contribution financière de l’UE entre les bénéficiaires directs du projet et d’autres types de participants, tels que les participants tiers.

€ 1 999 868,00
Coût total

Les coûts totaux encourus par l’organisation concernée pour participer au projet, y compris les coûts directs et indirects. Ce montant est un sous-ensemble du budget global du projet.

€ 1 999 868,00

Bénéficiaires (1)

Mon livret 0 0