Skip to main content

Article Category

Wiadomości

Article available in the folowing languages:

Jak szybko i skutecznie zidentyfikować ogromne zbiory danych genomowych, aby przyspieszyć badania nad koronawirusem

Międzynarodowy zespół badaczy testuje różne rozwiązania mające pomóc w uporządkowaniu i analizie ogromnej liczby danych pochodzących z sekwencjonowania genomu w celu ich wykorzystania w biomedycynie.

Zdrowie

Dzięki postępowi technologicznemu w dziedzinie sekwencjonowania, badacze mogą generować olbrzymie ilości danych na temat sekwencji genów u różnych gatunków. Analiza danych z sekwencji całego genomu, a więc całego zbioru genów, jakie posiadają wszyscy przedstawiciele danego gatunku, ma zasadnicze znaczenie szczególnie w kontekście badań nad bakteriami i wirusami, badania mechanizmów oporności na leki i rozwoju szczepionek. Pytania, które obecnie nurtują badaczy, brzmią: dlaczego koronawirus jest oporny na znane leki? Czy duże zbiory danych mogą pomóc w szybkiej charakterystyce nowych szczepów wirusa? Grupa badaczy z finansowanego ze środków UE projektu PANGAIA postanowiła znaleźć odpowiedzi na te pytania, opracowując metody porównywania gigantycznych zbiorów danych na temat genów. Jak można dowiedzieć się z komunikatu prasowego opublikowanego przez Uniwersytet w Bielefeld, jednego z partnerów projektu PANGAIA, naukowcy często wykorzystują genom referencyjny, aby sprawdzić, czy materiał genetyczny danego organizmu posiada konkretne warianty. „Uczeni łączą ze sobą kilka genomów w taki sposób, aby wykazywały typowe cechy całego gatunku. To pozwala porównać nowego wirusa grypy z genomem referencyjnym, który posiada typowe cechy szczepu wirusa, z którego się wywodzi”. Cytowany w tym samym komunikacie dr Jens Stoye, profesor Uniwersytetu w Bielefeld, tłumaczy: „W takich przypadkach porównuje się ze sobą tylko dwa genomy – zidentyfikowanie różnic i podobieństw przez komputer jest więc zadaniem względnie prostym”. I dodaje: „Dzięki nowemu podejściu możemy porównywać jeden genom z tysiącami innych genomów i to w jednym kroku”. Proces ten wymaga sekwencjonowania całego genomu. „Nowa technologia umożliwia jednoczasową, zintegrowaną analizę wielu szczepów tego samego organizmu. Mogą to być wirusy, bakterie, a zdarza się również, że organizmy wyższe”. Profesor Stoye kontynuuje: „To pozwala nam uwydatnić podobieństwa i różnice pomiędzy poszczególnymi osobnikami. W przypadku patogenów istnieje nawet możliwość poznania i przewidzenia procesów, które doprowadziły do rozwoju poszczególnych szczepów zakaźnych”.

Anomalie genetyczne

W tym samym komunikacie czytamy również, że nowa metoda może także posłużyć do wykrywania chorób dziedzicznych u ludzi lub oceny anomalii genetycznych. „W ciągu najbliższych kilku lat we współpracy z partnerami projektu będziemy chcieli opracować nowe algorytmy i struktury danych, dzięki czemu wspomagane komputerowo sekwencjonowanie całego genomu stanie się szybsze i bardziej przyjazne dla użytkownika” mówi dr Alexander Schönhuth, profesor na Uniwersytecie Bielefeld. Zespół badawczy ma nadzieję opracować algorytmy, które pozwalałyby komputerom na poszukiwanie podobieństw i różnic pomiędzy porównywalnymi genomami i przedstawianie wyników na wykresach zmian. Taka reprezentacja danych umożliwia badaczom „identyfikowanie całkiem nowych mutacji, takich jak te, które przypuszczalnie pojawiły się w wariancie koronawirusa”, który wydostał się z Chin i który „wykształcił oporność na znane nam leki”, tłumaczy prof. Schönhuth. Projekt PANGAIA (Pan-genome Graph Algorithms and Data Integration) potrwa do końca grudnia 2023 roku. Jego celem będzie przyjrzenie się możliwościom metody graficznej reprezentacji dużych zestawów danych genomicznych oraz wykazanie jej przewagi nad tradycyjną metodą przedstawiania danych z sekwencji całego genomu. Tak na stronie projektu w serwisie CORDIS badacze mówią swoim projekcie: „chcemy dokonać praktycznej zmiany paradygmatu – przechodzimy od sekwencji do graficznej reprezentacji genomu”. „W rezultacie możemy spodziewać się wielu korzyści istotnych z praktycznego punktu widzenia, z których najważniejszymi będą uporządkowanie, analiza, kompresja, integracja i wykorzystanie danych genomowych”. Więcej informacji: projekt PANGAIA

Słowa kluczowe

coronavirus

Kraje

Włochy

Powiązane artykuły