Pan-genome Graph Algorithms and Data Integration

Opis projektu

Graficzna reprezentacja danych z sekwencji genomu

Współczesna technologia sekwencjonowania generuje dane na temat sekwencji genomu na gigantyczną skalę sięgającą eksabajtów. Stąd pilna potrzeba opracowania metod, które w sposób wydajny obliczeniowo i sensowny z biomedycznego punktu widzenia będą porządkowały i analizowały dane o tak dużej objętości. Celem finansowanego ze środków UE projektu jest przyjrzenie się możliwościom metody graficznej reprezentacji dużych zestawów danych genomicznych oraz ustalenie jej przewagi nad tradycyjną metodą przedstawiania danych z sekwencji całego genomu. Genomy, które są sobie ewolucyjnie bliskie, różnią się od siebie tylko nieznacznie, a graficzna reprezentacja całego genomu umożliwia pominięcie elementów zbędnych i podkreślenie istotnych różnic. Badacze zamierzają wykazać zalety nowego podejścia do przedstawiania danych i w tym celu zastosują metody analizy porównawczej, kompresji, integracji i wykorzystania danych genomowych decydujące o tej fundamentalnej różnicy.

Cel

Genomes are strings over the letters A,C,G,T, which represent nucleotides, the building blocks of DNA. In view of ultra-large amounts of genome sequence data emerging from ever more and technologically rapidly advancing genome sequencing devices—in the meantime, amounts of sequencing data accrued are reaching into the exabyte scale—the driving, urgent question is: how can we arrange and analyze these data masses in a formally rigorous, computationally efficient and biomedically rewarding manner?
Graph based data structures have been pointed out to have disruptive benefits over traditional sequence based structures when representing pan-genomes, sufficiently large, evolutionarily coherent collections of genomes. This idea has its immediate justification in the laws of genetics: evolutionarily closely related genomes vary only in relatively little amounts of letters, while sharing the majority of their sequence content. Graph-based pan-genome representations that allow to remove redundancies without having to discard individual differences, make utmost sense. In this project, we will put this shift of paradigms—from sequence to graph based representations of genomes—into full effect. As a result, we can expect a wealth of practically relevant advantages, among which arrangement, analysis, compression, integration and exploitation of genome data are the most fundamental points. In addition, we will also open up a significant source of inspiration for computer science itself.

Dziedzina nauki

Słowa kluczowe

Program(-y)

Koordynator

UNIVERSITA' DEGLI STUDI DI MILANO-BICOCCA

Wkład UE netto

€ 197 800,00

Adres

PIAZZA DELL'ATENEO NUOVO 1
20126 MILANO
Włochy

Region

Nord-Ovest Lombardia Milano

Rodzaj działalności

Higher or Secondary Education Establishments

Linki

Kontakt z organizacją Strona internetowa

Uczestnictwo w unijnych programach w zakresie badań i innowacji

sieć współpracy HORIZON

Koszt całkowity

€ 197 800,00

Uczestnicy (6)

STICHTING NEDERLANDSE WETENSCHAPPELIJK ONDERZOEK INSTITUTEN

Niderlandy

Wkład UE netto

€ 55 200,00

UNIVERSITAET BIELEFELD

Niemcy

Wkład UE netto

€ 289 800,00

UNIVERZITA KOMENSKEHO V BRATISLAVE

Słowacja

Wkład UE netto

€ 128 800,00

GENETON S.R.O.

Słowacja

Wkład UE netto

€ 322 000,00

INSTITUT PASTEUR

Francja

Wkład UE netto

€ 147 200,00

ILLUMINA CAMBRIDGE LIMITED

Zjednoczone Królestwo

Wkład UE netto

€ 0,00

Partnerzy (6)

Partner

CORNELL UNIVERSITY

Stany Zjednoczone

Wkład UE netto

€ 0,00

Partner

NATIONAL UNIVERSITY CORPORATION THEUNIVERSITY OF TOKYO

Japonia

Wkład UE netto

€ 0,00

Partner

Simon Fraser University

Kanada

Wkład UE netto

€ 0,00

Partner

THE PENNSYLVANIA STATE UNIVERSITY

Stany Zjednoczone

Wkład UE netto

€ 0,00

Partner

THE REGENTS OF THE UNIVERSITY OF CALIFORNIA

Stany Zjednoczone

Wkład UE netto

€ 0,00

Partner

HUNAN UNIVERSITY

Chiny

Wkład UE netto

€ 0,00

Opis projektu

Graficzna reprezentacja danych z sekwencji genomu

Cel

Dziedzina nauki

Słowa kluczowe

Program(-y)

Temat(-y)

Zaproszenie do składania wniosków

System finansowania

Koordynator

Uczestnicy (6)

Partnerzy (6)

Udostępnij tę stronę

Pobierz