European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Safe and Complete Algorithms for Bioinformatics

Opis projektu

Rozwiązania obliczeniowe problemów biologicznych

Bioinformatyka jest nową i szybko rozwijającą się dziedziną wiedzy, opartą na biologii molekularnej i biochemii, a także na informatyce oraz matematyce. Wiele rzeczywistych problemów ważnych dla świata biologii może zostać przedstawione w formie modeli obliczeniowych, lecz ze względu na niekompletne dane przeprowadzenie obliczeń prowadzi do uzyskania wielu różnorodnych wyników, a znalezienie właściwego staje się bardzo trudne. W ramach finansowanego przez Unię Europejską projektu SAFEBIO powstaną pierwsze bezpieczne algorytmy obejmujące szereg podstawowych problemów związanych z wykresami, przepływami w sieciach i programowaniem dynamicznym. Celem projektu będzie opracowanie zautomatyzowanych i skutecznych sposobów zgłaszania wszystkich bezpiecznych podrozwiązań poszczególnych problemów. W ramach projektu opracowane praktyczne narzędzia zostaną zastosowane do badań nad składaniem genomu i RNA, a także analizy genomu.

Cel

"Many real-world problems are modeled as computational problems, but unfortunately with incomplete data or knowledge. As such, they may admit a large number of solutions, and we have no way of finding the correct one. This issue is sometimes addressed by outputting all solutions, which is infeasible for many practical problems. We aim to construct a general methodology for finding the set of all sub-solutions common to all solutions. We can ultimately trust these to be part of the correct solution. We call this set ""safe"". Ultimately, we aim at creating automated and efficient ways of reporting all safe sub-solutions of a problem. The main motivation of this project comes from Bioinformatics, in particular from the analysis of high-throughput sequencing (HTS) of DNA. One of the main applications of HTS data is to assemble it back into the original DNA sequence. This genome assembly problem admits many solutions, and current research has indeed considered outputting only partial solutions that are likely to be present in the correct original DNA sequence. However, this problem has been approached only from an experimental point of view, with no definite answer on what are all the safe sub-solutions to report. In fact, the issue of safe sub-solutions has been mostly overlooked in Bioinformatics and Computer Science in general. This project will derive the first safe algorithms for a number of fundamental problems about walks in graphs, network flows, dynamic programming. We will apply these inside practical tools for genome assembly, RNA assembly and pan-genome analysis. This is very relevant at the moment, because HTS goes from research labs to hospitals, and we need answers that are first of all accurate. Our approach changes the perspective from which we address all real-world problems, and could spur a new line of research in Computer Science/Bioinformatics. The grand aim is a mathematical leap into understanding what can be safely reported from the data."

System finansowania

ERC-STG - Starting Grant

Instytucja przyjmująca

HELSINGIN YLIOPISTO
Wkład UE netto
€ 1 498 367,00
Adres
YLIOPISTONKATU 3
00014 Helsingin Yliopisto
Finlandia

Zobacz na mapie

Region
Manner-Suomi Helsinki-Uusimaa Helsinki-Uusimaa
Rodzaj działalności
Higher or Secondary Education Establishments
Linki
Koszt całkowity
€ 1 498 367,00

Beneficjenci (1)