Skip to main content
Oficjalna strona internetowa Unii EuropejskiejOficjalna strona internetowa UE
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS
CORDIS Web 30th anniversary CORDIS Web 30th anniversary
Zawartość zarchiwizowana w dniu 2024-06-18
Algorithms and Tools for Mining Biological Sequence Data

Article Category

Article available in the following languages:

Algorytmy do analizy sekwencji kwasów nukleinowych

Bioinformatyka wykorzystuje narzędzia informatyczne do analizy złożonych danych biologicznych. Udoskonalone metody przetwarzania danych z sekwencjonowania odnoszących się do sekwencji kwasów nukleinowych i białek pokonują aktualne ograniczenia i wspierają wysiłki w zakresie sekwencjonowania.

Komputery zmieniły sposób, w jaki dziedziny od automatyzacji przemysłowej przez mechanikę kwantową po biomedycynę podchodzą do złożonych problemów. Bioinformatyka stara się ustanowić ścieżkę łączącą informację genetyczną (sekwencje kwasów nukleinowych lub białek) z fenotypem (obserwowalne cechy, symptomy lub zaburzenia). Finansowany przez UE projekt badawczy "Algorithms and tools for mining biological sequence data" (ALMOND) zainicjowano w celu opracowania nowych technik w celu rozwiązania kilku istotnych problemów w zakresie molekularnej biologii obliczeniowej. Metodologia położyła nacisk na metody programowania dynamicznego, które identyfikują prostsze "problemy szczegółowe" trudnego problemu, powtarzające się wzorce, które się do nich odnoszą i w konsekwencji rozwiązanie problemów podstawowych. W ramach ALMOND badacze opracowali nowatorskie efektywne algorytmy do porównywania sekwencji białek. Skupili się oni na nowym wariancie specjalnej ścieżki dopasowania — wymuszonym dopasowaniu sekwencji (zwanej dopasowaniem sekwencji z ograniczeniem ścieżki ekspresji regularnej (SA-REPC)). Badacze stworzyli dwa nowe rozwiązania tego problemu analizy sekwencji. Oba można pobrać ze strony strona gospodarza(odnośnik otworzy się w nowym oknie). Uczeni opracowali również nowe algorytmy do porównywania sekwencji i struktur RNA, kiedy sekwencje RNA znajdują się w obszarze kodowania, co występuje powszechnie u wirusów i bakterii. Metody umożliwiają prognozowanie najbardziej prawdopodobnego wspólnego przodka dwóch RNA, przezwyciężając ograniczenia zwykłych algorytmów porównania. Kilka algorytmów dotyczyło kwestii związanych z sekwencjonowaniem nowej generacji (NGS). Pierwszym etapem wielu analiz danych NGS jest zestawienie krótkich odczytów z istniejącym genomem referencyjnym. Nowe metody mapowania są skuteczniejsze od istniejących algorytmów, wprowadzając znaczne ulepszenia. Nowatorska struktura danych dla wykresu wykorzystywanego przez większość praktycznych metod sekwencji genomu dla danych NGS pokonuje poważną przeszkodę w obliczeniowym przetwarzaniu danych. Zwiększenie dostępnej pamięci o 30-40% jest teraz wykorzystywane w oprogramowaniu podmiotu zewnętrznego (Minia). W ramach projektu ALMOND stworzono ważne nowe algorytmy pokonujące ograniczenia aktualnych narzędzi w zakresie bioinformatyki i analizy sekwencji. Powyższe jak i również inne wyniki zaprezentowano w licznych publikacjach, a projekt przyczynił się do nawiązania nowej współpracy między Francją a Izraelem. W związku z powyższym, oczekuje się, że projekt będzie miał długotrwały wpływ na istotną ze społeczno-ekonomicznego punktu widzenia dziedzinę bioinformatyki.

Słowa kluczowe

Sekwencje kwasów nukleinowych, bioinformatyka, dane biologiczne, biologia molekularna, sekwencjonowanie nowej generacji

Znajdź inne artykuły w tej samej dziedzinie zastosowania