Wspólna infrastruktura dla wszystkich badań biomedycznych
Zrzeszający 12 europejskich infrastruktur badań biomedycznych projekt BIOMEDBRIDGES(odnośnik otworzy się w nowym oknie) (Building data bridges between biological and medical infrastructures in Europe) ma na celu wyeliminowanie przeszkód utrudniających wymianę danych i interoperacyjność w obrębie poszczególnych dyscyplin nauk przyrodniczych oraz między nimi. Łączy on dane należące do różnych skal przestrzennych, rodzajów, technologii i społeczności badawczych, aby stworzyć nowe metody analizowania problemów i umożliwić udzielenie odpowiedzi na nowe, bardziej skomplikowane pytania stawiane przez naukę. W tym celu w projekcie wykorzystywane są dwie grupy narzędzi oraz konkretne przypadki użycia, pozwalające na zademonstrowanie ich możliwości: z jednej strony są to narzędzia przeznaczone dla biomedyków różnych dyscyplin, a z drugiej narzędzia podręczne przeznaczone dla określonych grup użytkowników lub też do konkretnych problemów badawczych. "Przykładem narzędzia pierwszego rodzaju jest rejestr Meta Service Registry. Gromadzi on w jednym miejscu szereg programów i narzędzi biomedycznych i ułatwia uczonym ich znajdowanie, porównywanie i używanie. Dzięki niemu naukowcy mogą poszukiwać odpowiedzi na pytania badawcze, takie jak: "Jaki narzędzia z zakresu ontologii genów są dostępne?" lub "Które z nich są najczęściej cytowane?". Zwracający istotne, uporządkowane wyniki rejestr stanowi uzupełnienie wyszukiwarek internetowych, takich jak Google: użytkownik może określić, czego dokładnie potrzebuje, korzystając z różnych opcji wyszukiwania i filtrowania, oraz otrzymać listę odpowiednich zasobów. Zakres dziedzin dostępnych w rejestrze jest bardzo szeroki, od sekwencjonowania i struktur po obrazowanie i indeksowanie, dzięki czemu obejmuje większość działań prowadzonych przez partnerów BIOMEDBRIDGES", objaśnia Friederike Schmidt-Tremmel, kierownik projektu w organizacji ELIXIR i koordynator inicjatywy BIOMEDBRIDGES. Innym przykładem jest narzędzie do oceny aspektów prawnych i etycznych ("Legal and ethical requirements assessment tool", LAT), które pomaga uczonym w używaniu wrażliwych danych, bez konieczności zasięgania rad ekspertów. Wyjaśnia ono, czy i w jaki sposób określony rodzaj i format danych może być udostępniany oraz kiedy potrzebne są dodatkowe działania i specjalistyczne porady — co pozwala uczonym zaoszczędzić cenny czas. Przykładem drugiej grupy narzędzi jest DIAB Ontology, wypełniające lukę między badaniami prowadzonymi na modelach mysich oraz badaniami na ludziach w zakresie cukrzycy typu 2 i otyłości. "Naukowcy pracujący z pacjentami oraz uczeni zajmujący się modelami mysimi należą do różnych, często niepowiązanych ze sobą społeczności, z których każda ma własną ontologię. Dostępnych jest przeszło 100 badań asocjacyjnych całego genomu (GWAS), prowadzonych na ludziach i opatrzonych adnotacją "cukrzyca" oraz ponad 750 modeli mysich (fenotypów) oznaczonych jako "zwiększony poziom glukozy we krwi"", opowiada Schmidt-Tremmel i dodaje: "Narzędzie DIAB Ontology przekracza granicę gatunkową między badaniami na modelach mysich i na ludziach dzięki stworzeniu specyficznej dla cukrzycy ontologii dla obu tych dziedzin i udostępnieniu badaczom klinicznym obszernych danych dotyczących fenotypu myszy. Klinicyści mogą teraz porównywać genom człowieka z genomem sprawdzonego modelu eksperymentalnego — myszy — cierpiącego na to samo schorzenie oraz bliżej przyglądać się mechanizmom metabolizmu glukozy". Dzięki tym narzędziom uczestnicy projektu chcą przyspieszyć proces prowadzenia badań, zarówno tych podstawowych, jak i badań nad konkretnymi rozwiązaniami rynkowymi, na przykład lekami. "W projekcie BIOMEDBRIDGES rozszerzono narzędzie UniChem, opracowane w ramach infrastruktury EU-OPENSCREEN, aby połączyć ze sobą liczne bazy danych dotyczących małych cząsteczek chemicznych. Uczestnicy projektu BIOMEDBRIDGES opracowali funkcję wyszukiwania powiązań, umożliwiającą użytkownikom znajdowanie nie tylko takich samych związków chemicznych w różnych zasobach, ale także podobnych związków, różniących się pod względem określonych cech. W ten sposób narzędzie UniChem znajduje i łączy 60 milionów powiązanych cząsteczek z 21 źródeł danych z całego świata, w tym informacje na temat tego, czy dany związek został opatentowany oraz jakie badania były na nim prowadzone", tłumaczy Schmidt-Tremmel. "Ta funkcja może usprawnić badania nad mechanizmem działania istniejącego leku i jego potencjalnymi alternatywnymi zastosowaniami, co ma szczególne znaczenie przy opracowywaniu nowych środków farmaceutycznych, a wczesna selekcja najbardziej obiecujących związków może pozwolić na zaoszczędzenie mnóstwa czasu i pieniędzy". Przygotowano w sumie pięć przypadków użycia, analizując integrację danych z perspektywy odpowiednich społeczności użytkowników lub konkretnego tematu badań. Są to: narzędzie PhenoBridge, łączące badania na myszach i ludziach; interoperacyjność dużych zbiorów danych graficznych dotyczących różnych skal biologicznych; medycyna spersonalizowana (połączenie złożonych zbiorów danych w celu badania patogenezy chorób oraz usprawnienia selekcji biomarkerów i metod leczenia); od komórek do cząsteczek (integracja danych strukturalnych); i wreszcie integracja danych dotyczących chorób i terminologii na podstawie próbek różnego rodzaju. Wielowarstwowe podejście W projekcie BIOMEDBRIDGES zastosowano wielowarstwowe podejście do integracji dostępnych danych: interoperacyjność osiągana jest poprzez harmonizację zasobów z różnych infrastruktur badawczych. W tym celu w pierwszej kolejności konieczne jest wykorzystanie sprawdzonych technologii, ale w dalszej perspektywie uczestnicy projektu chcą uzyskać bardziej zaawansowaną interoperacyjność semantyczną i interfejsy użytkownika, które umożliwią uczonym znajdowanie — w ramach jednego kroku — informacji najbardziej istotnych dla konkretnego zagadnienia naukowego lub choroby wśród milionów pozycji. "To etapowe, warstwowe podejście oznacza, że możliwe jest systematyczne przenoszenie wszystkich infrastruktur badawczych i zasobów danych na wyższy poziom integracji", mówi Schmidt-Tremmel. "Swego rodzaju skutkiem ubocznym jest wiedza, która umożliwi w przyszłości wszystkim zaangażowanym stronom zwiększanie interoperacyjności danych. Kontynuowana współpraca daje także szansę na rzeczywistą integrację — a być może nawet zmianę kultury — różnych dyscyplin nauk przyrodniczych w odniesieniu do danych". Kolejny krok: CORBEL Wiele narzędzi opracowanych w ramach projektu BIOMEDBRIDGES zostało już udostępnionych użytkownikom za pośrednictwem zrzeszonych w inicjatywie infrastruktur badawczych. Są one, lub będą, wykorzystywane w różnych usługach oferowanych przez te infrastruktury. Na przykład, wiedza uzyskana podczas prac nad prototypem narzędzia BIOMEDBRIDGES Meta Service Registry została spożytkowana w serwisie ELIXIR Tools and Data Service Registry (bio.tools) a LAT stanie się częścią szerszej usługi pomagającej użytkownikom i dostawcom danych wrażliwych w ramach wspólnego serwisu ELSI ("Ethical, legal and social implications"), który ma powstać w projekcie CORBEL. Rozpoczęty we wrześniu 2015 r. projekt CORBEL wykorzystuje zdobycze inicjatywy BIOMEDBRIDGES do stworzenia platformy zapewniającej zharmonizowany dostęp do technologii biologicznych i medycznych, próbek biologicznych i usług danych potrzebnych w nowoczesnych badaniach biomedycznych.
Słowa kluczowe
Biotechnologia, badania biomedyczne, interoperacyjność, wymiana danych