Partnerzy projektu UE opracują system korelujący wzorce genetyczne i dane o środowisku
Zadaniem partnerów uruchomionego niedawno projektu METAFUNCTIONS jest opracowanie systemu eksploracji danych, zestawiającego wzorce genetyczne w genomach i metagenomach z informacjami dotyczącymi kontekstu środowiskowego. Rozszyfrowanie materiału genetycznego wszystkich gatunków mikrobiologicznych może wskazać naukowcom, które gatunki są obecne w określonym środowisku i jak ze sobą współpracują, umożliwiając wydobycie na światło dzienne tysięcy nieznanych wcześniej mikroorganizmów, nowych enzymów i białek z myślą o ich wykorzystaniu w medycynie i przemyśle, oraz poznanie sposobów zastosowania bakterii do walki z zanieczyszczeniami środowiska. Wyznaczanie kompletnej sekwencji DNA pojedynczego gatunku stało się powszechne - zostało dokonane dla ludzi, myszy, ryżu i wielu mikroorganizmów. W ciągu ostatnich siedmiu lat udało się ustalić sekwencję ponad 260 genomów mikrobiologicznych, a prace nad ponad 600 genomami trwają. Naukowcy wiedzą, że tradycyjne metody wyodrębniania DNA nie mogą być zastosowane w badaniach blisko 99 procent mikroorganizmów. Jednakże istnieje możliwość pozyskania DNA z próbek gleby lub wody morskiej. Aby zatem dotrzeć do tego zróżnicowanego, ukrytego świata, trzeba użyć nowych technik. Zadaniem tych technik jest doprowadzenie do odczytania całego łańcucha DNA w koloniach bakterii znajdujących się w grudce ziemi lub w kropli morskiej wody, czy nawet w nabłonku ludzkiego jelita. Sekwencje takich próbek zwane są "metagenomami" - nie genomem danego organizmu, ale materiałem genetycznym określonego środowiska. Sednem nowych metod jest pobranie DNA z danego środowiska, a następnie wstawienie jego fragmentu do plazmidu ekspresyjnego, przez co tworzona jest biblioteka "metagenomiczna". Końcowym etapem jest funkcjonalne przeanalizowanie ekspresji DNA pod kątem różnorodnych czynności. Ujawnia się bogactwo informacji o metagenomach - i poważny brak narzędzi do ich analizy. Nie jest to łatwe zadanie: w garści ziemi lub łyżce wody morskiej mogą znajdować się tysiące różnych gatunków mikrobiologicznych, co oznacza, że w sensie genetycznym taka próbka może być bardziej skomplikowana niż genom ludzki. Poza tym jak dotąd badania nad metagenomiką w większości koncentrowały się na bakteriach, które są istotne z medycznego punktu widzenia, zaś organizmy ważne dla środowiska (np. te biorące udział w produkcji i zużywaniu metanu) nie przyciągały aż tak dużej uwagi. Projekt METAFUNCTIONS, finansowany przez Komisję Europejską w ramach NEST, programu Nauka i technologia przyszłości szóstego programu ramowego (6. PR), ma na celu wyjście naprzeciw tym wyzwaniom poprzez opracowanie nowatorskiego systemu eksploracji danych, który umożliwi poznanie zależności pomiędzy sekwencją genów a kontekstem środowiskowym i ekologicznym. Projekt, koordynowany przez niemiecki Instytut Mikrobiologii Morskiej Maksa Plancka, integruje wiedzę z różnorodnych dziedzin: bioinformatyki, informatyki, systemów informacji geograficznej oraz nauk o morzu z czterech europejskich ośrodków badawczych zlokalizowanych w Niemczech, w Szwajcarii i w Polsce. Oficjalna nazwa projektu brzmi "genomika środowiskowa i metagenomika - system bioinformatyczny do wykrywania i przypisywania funkcji wzorcom genów specyficznych dla danego środowiska"; jego ostatecznym celem jest określenie funkcji nieznanych jeszcze genów, zwanych "genami hipotetycznymi". Innowacyjna kombinacja wiedzy ma szansę doprowadzić do powstania technologii o szerokiej gamie zastosowań i potencjalnie wysokiej opłacalności. W ramach projektu budowana jest baza danych ("Genomes MapServer"), dzięki której naukowcy na całym świecie uzyskają wkrótce dostęp do zintegrowanych danych o genomach i środowisku oraz możliwość przejrzystej wizualizacji wyników swych analiz. Partnerzy projektu METAFUNCTIONS wykorzystują techniki przetwarzania języka naturalnego do zestawiania informacji pochodzących z publikacji i nadawania im uporządkowanej formy bazy danych. Projekt opiera się także w znacznym stopniu na technikach eksploracji danych w celu zidentyfikowania nowych lub interesujących modeli w informacjach dotyczących genomów. Innym innowacyjnym aspektem projektu jest wykorzystanie systemów informacji geograficznej (GIS). Narzędzia GIS umożliwiają symulację i analizę zdarzeń z perspektywy geograficznej lub przestrzennej. Nowe wzorce - np. fizycznego zgrupowania genów w genomie - będą korelowane z danymi dotyczącymi kontekstu środowiskowego. Na przykład określone zgrupowanie genów można znaleźć w szeregu genomów i metagenomów, pochodzących ze środowisk charakteryzujących się wysoką temperaturą. Sensowne byłoby przypuszczenie, że taki gen musi w jakiś sposób przyczyniać się do przetrwania w wyjątkowo gorącym otoczeniu. Projekt METAFUNCTIONS pomoże zwłaszcza w nadrobieniu zaległości związanych z przypisywaniem funkcji dużej liczbie zachowanych hipotetycznych genów, które zostały wytworzone w toku wysokowydajnego sekwencjonowania genomów. Ekologia morska, biotechnologia, medycyna i wiele sektorów przemysłu mogłoby odnieść korzyści z mapowania w genomice środowiskowej, dokonywanego przez partnerów projektu. Potencjalna opłacalność projektu jest wysoka: bakterie stanowią ponad połowę materii ożywionej na Ziemi i odgrywają ważną rolę w licznych procesach zachodzących w środowisku. Przekształcają one azot znajdujący się w powietrzu w formę użyteczną dla roślin, produkują około połowę tlenu naszej planecie, rozkruszają minerały i eliminują zanieczyszczenia.