Skip to main content
European Commission logo print header

Artificial intelligence, branching processes and coalescent –<br/>Searching the Information from a genetic Cornucopia

Article Category

Article available in the following languages:

Uczenie się na podstawie zasobów genetycznych

W ostatnich latach coraz szerzej stosuje się intensywne obliczeniowo metody analizy sygnałów biomedycznych. Podejście to opiera się na sztucznej inteligencji, w której programy komputerowe naśladują organizację ludzkiego mózgu i "uczą się" ważnych cech na podstawie zbioru danych.

Technologie przemysłowe icon Technologie przemysłowe

Komputery przetwarzają informacje szeregowo i umożliwiają rozwiązywanie problemów, z którymi ludzie sami nigdy nie mogliby się uporać. Specjalistyczne systemy prześcignęły ludzi w wykonywaniu wielu różnych zadań. Mimo to, funkcje jakościowe, dzięki którym mózg rozpoznaje wzorce w celu osądu sytuacji, są wciąż bardzo trudne do wykonywania dla komputerów. W ramach projektu ARSINFORMATICA (Artificial intelligence, branching processes and coalescent – Searching the information from a genetic cornucopia), finansowanego ze środków UE, naukowcy badali możliwości systemów uczenia maszynowego do przeczesywania danych genomowych. Celem było znalezienie zależności między genotypami i chorobami oraz dokładniejsze zrozumienie doboru naturalnego. Opracowano modele matematyczne umożliwiające zbadanie, w jaki sposób mogło dojść do zachowania barier genowych między współczesnymi ludźmi i neandertalczykami. Podstawą tego intrygującego problemu był okres współistnienia neandertalczyka i Homo Sapiens. Naukowcy przyjrzeli się krzyżówkom między dwoma populacjami, aby potwierdzić wyniki ostatnich badań DNA. Ponadto poszukiwano sygnatur doboru naturalnego na poziomie molekularnym w danych dotyczących polimorfizmów pojedynczego nukleotydu. Wyniki powszechnie wykorzystywanych badań przesłaniane są przez hipotezy, na przykład dotyczące wzrostu populacji czy struktury geograficznej populacji. Naukowcy podeszli do tego problemu, stosując szereg hipotez zerowych, zakładających różne scenariusze dotyczące populacji. Możliwości tzw. metody wielu hipotez zerowych jako generatora wiedzy zademonstrowano podczas poszukiwania mechanizmów doboru naturalnego w genach powiązanych z dziedzicznymi nowotworami u ludzi. Mimo wysokich wymagań obliczeniowych oraz związanego z tym braku możliwości stosowania do podobnych poszukiwań w wielu genach, metoda ta okazała się skuteczna w ocenie wpływu zmian zachodzących w czasie i zmian demograficznych na wielkość populacji. Artykuły naukowe z wynikami badań zostały opublikowane w ośmiu naukowych pismach branżowych i były prezentowane na międzynarodowych konferencjach. Głównym celem projektu ARSINFORMATICA było umocnienie wymiaru międzynarodowego badań z zakresu biologii obliczeniowej i bioinformatyki w Polsce. Nawiązano również współpracę z USA. Zacieśnienie współpracy badawczej na poziomie międzynarodowym przyczyni się do umocnienia Europejskiej Przestrzeni Badawczej (EPB). Opracowane techniki uczenia maszynowego i oparte na nich praktyczne narzędzia powinny znaleźć zastosowanie także w dziedzinach innych niż genetyka. Algorytmy uczenia maszynowego w połączeniu z procesami eksploracji danych umożliwią rozpoznawanie wzorców nawet w nieuporządkowanych danych.

Słowa kluczowe

Zasoby genetyczne, sztuczna inteligencja, ARSINFORMATICA, uczenie maszynowe, dane genomowe, dobór naturalny

Znajdź inne artykuły w tej samej dziedzinie zastosowania