Skip to main content
Przejdź do strony domowej Komisji Europejskiej (odnośnik otworzy się w nowym oknie)
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Article Category

Zawartość zarchiwizowana w dniu 2023-03-02

Article available in the following languages:

Pojawia się nowe narzędzie do kontrolowania jakości bazy danych białek

Publiczne bazy danych nadal zawierają nieprawidłowe, niepełnie lub błędnie przewidziane geny i białka, mimo ostatnich wysiłków, aby udoskonalić komputerowe opisy genomów. Błędy te stawiają pod znakiem zapytania wiarygodność baz danych. Jednakże zespół naukowców opracował nowe ...

Publiczne bazy danych nadal zawierają nieprawidłowe, niepełnie lub błędnie przewidziane geny i białka, mimo ostatnich wysiłków, aby udoskonalić komputerowe opisy genomów. Błędy te stawiają pod znakiem zapytania wiarygodność baz danych. Jednakże zespół naukowców opracował nowe narzędzie, nazwane MisPred, które jest skutecznym sposobem na kontrolowanie jakości bazy danych. Prace, ostatnio opisane w ogólnodostępnym czasopiśmie BMC Bioinformatics, prowadzone były jako projekt UE pt. BioSapiens, finansowany na kwotę 12 mln EUR w ramach tematu "Nauki o życiu, genomika i biotechnologia na rzecz zdrowia" Szóstego Programu Ramowego (6PR). Narzędzie MisPred, jak informuje zespół, korzysta z pięciu podstawowych reguł w celu identyfikacji podejrzanych, nieprawidłowych, niepełnych czy błędnie przewidzianych wpisów, w oparciu o założenie, że sekwencja będzie prawdopodobnie błędna, jeśli któraś z jej części kłóci się z dostępną obecnie wiedzą o genach kodujących białka i o białkach: (1) białka pozakomórkowe lub przezbłonowe muszą posiadać odpowiednie sygnały wydzielnicze; (2) w białku posiadającym części wewnątrz- i pozakomórkowe musi się znaleźć segment przezbłonowy; (3) w jednym białku nie mogą znaleźć się jednocześnie domeny pozakomórkowe i jądrowe; (4) liczba reszt aminokwasów u blisko powiązanych członków rodziny domeny globularnej musi mieścić się w stosunkowo niewielkim przedziale; oraz (5) białko musi być kodowane przez eksony umieszczone na jednym chromosomie. Kierownikiem zespołu był profesor L szl¢ Patthy z Instytutu Enzymologii Węgierskiej Akademii Nauk. "Ostatnie badania pokazały, że znaczna część genów eukariotycznych jest nieprawidłowo przewidywana na poziomie transkrypcji" - stwierdził profesor Patthy. "Ponieważ analizy wykonywane przez MisPred są w stanie wykryć wiele tego typu błędów i mogą pomóc w ich usunięciu, wydaje się nam, że narzędzie to może znacznie poprawić jakość danych opisujących sekwencje białka w oparciu o przewidywanie genów." Profesor Patthy zaznaczył jednak, że w wielu wydzielanych białkach może rzeczywiście "brakować peptydów sygnałowych, ponieważ zostały wydzielone bez sekwencji liderowej". Dodał jeszcze: "Nie można także wykluczyć na obecnym etapie, że nie powstają transchromosomalne chimery, które pełnią normalne funkcje fizjologiczne. Mimo to, fakt że analizy bazy danych Swiss-Prot wykonane za pomocą narzędzia MisPred wykazały bardzo niewiele takich wyjątków, dowodzi, że reguły, którymi kieruje się MisPred znajdują na ogół zastosowanie." Badanie wykazało, że większość błędnych przewidywań wynika z braku spodziewanych peptydów sygnałowych oraz z naruszenia integralności domeny. "Co ciekawe - komentuje zespół - nawet w ręcznie korygowanym zbiorze danych UniProtKB/Swiss-Prot znajdują się błędnie przewidziane lub nieprawidłowe białka, choć błędnie przewidzianych pozycji jest znacznie mniej niż w bazach UniProtKB/TrEMBL, EnsEMBL czy GNOMON." Według członków zespołu narzędzie MisPred pozwoli naukowcom zyskać więcej czasu na prowadzenie większej liczby badań w zakresie błędnie przewidywanych genów.

Powiązane artykuły

Moja broszura 0 0