European Commission logo
polski polski
CORDIS - Wyniki badań wspieranych przez UE
CORDIS

Archiving and Preservation for Research Environments

Article Category

Article available in the following languages:

Długotrwała archiwizacja danych

W ramach nagrodzonego projektu finansowanego przez UE powstał szereg innowacyjnych rozwiązań w zakresie archiwizacji, ochrony i dostępu do ogromnych i bardzo cennych zbiorów danych naukowych.

Gospodarka cyfrowa icon Gospodarka cyfrowa

Obecnie dane nazywa się cyfrowym złotem. Zespół finansowanego ze środków Unii Europejskiej projektu ARCHIVER twierdzi jednak, że „rzeczywistość jest nieco bardziej złożona”. „To prawda, że dane są niezwykle ważne i cenne, ale równie ważna jest ich archiwizacja, która zapewnia ciągły dostęp do badań tak długo, jak to konieczne, przy jednoczesnym zachowaniu ich rzetelności”, twierdzi João Fernandes, lider projektu ARCHIVER z ramienia Europejskiej Organizacji Badań Jądrowych (CERN) i jego koordynator. „Niestety, ze względu na nieuwzględnienie na etapie planowania kosztów archiwizacji oraz niedostatków istniejących rozwiązań większość zespołów badawczych ma problemy z prawidłową archiwizacją swoich danych, która pozwoli na ich wykorzystanie w dłuższej perspektywie czasowej”. Aby oddać danym ich należną pozycję, zespół projektu ARCHIVER zaprojektował innowacyjne rozwiązania dla długoterminowej archiwizacji cyfrowej zbiorów danych naukowych, a także opracował prototypy i zrealizował ich pilotażowe wdrożenia.

Rozwiązania dostępne już teraz

Prace w ramach projektu były oparte na realnych potrzebach wielu interesariuszy, wśród których można wymienić między innymi jednostki takie jak CERN, DESY, EMBL-EBI oraz PIC. „Nasze prace rozpoczęliśmy od określenia luk i braków w istniejących rozwiązaniach oferowanych podmiotom w sektorze badań, czerpiąc wnioski z dotychczasowych prób i projektów dotyczących tego zagadnienia”, wyjaśnia Fernandes. „Następnie wprowadziliśmy w życie elastyczny model badawczo-rozwojowy obejmujący szereg dziedzin naukowych. Postanowiliśmy, że nasze rozwiązanie będzie dostępne zarówno dla publicznych organizacji badawczych, jak i ekspertów w dziedzinie archiwizacji i ochrony danych”. Jednym z efektów tych prac było rozwiązanie Arkivum – oprogramowanie archiwizujące dane dostępne w modelu oprogramowanie jako usługa (SaaS). Rozwiązanie to pozwala na archiwizację, ochronę i zapewnianie dostępu do ogromnych i bardzo cennych zbiorów danych naukowych, a ponadto jest doskonale dostosowane do danych dotyczących dziedzin takich jak astronomia, fizyka cząstek elementarnych i genomika. „Nasza usługa jest wyjątkowa – pozwala na archiwizację oraz utrzymywanie zbiorów obejmujących wiele petabajtów danych w sposób opłacalny i przyjazny dla środowiska”, zauważa Fernandes. Innym rozwiązaniem opracowanym w ramach projektu jest LIBNOVA LABDRIVE. „Przed wprowadzeniem rozwiązania LIBNOVA LABDRIVE wiele organizacji stosowało silosowe podejście do ochrony danych – każdy wydział i każda jednostka utrzymywała swoje zbiory danych w wielu niepowiązanych ze sobą systemach”, dodaje Fernandes. „Opracowany w ramach naszego projektu nowy produkt pozwala wszystkim zainteresowanym stronom magazynować swoje dane w ramach pojedynczego repozytorium, które można łatwo dostosować do specyfiki każdego zbioru, co umożliwia ujednolicenie wszystkich danych w ramach jednej platformy”. Oba rozwiązania – Arkivum oraz LABDRIVE są dostępne za pośrednictwem europejskiej chmury dla otwartej nauki (EOSC).

Nowy paradygmat

Jak twierdzi Fernandes, usługi opracowane w ramach projektu ARCHIVER będą stanowiły wyjątkowe rozwiązanie. Co więcej, przyczynią się bezpośrednio do rozwoju co najmniej 18 paneuropejskich infrastruktur, które są wykorzystywane łącznie przez 1,7 miliona europejskich naukowców. Nie należy przy tym zapominać o 70 milionach pracowników naukowych, specjalistów IT oraz innych osób, które będą korzystać z tych rozwiązań za pośrednictwem EOSC.

To wiele osób i jeszcze więcej danych

„Projekt ARCHIVER zapoczątkowuje nowy paradygmat w zakresie ochrony danych badawczych w perspektywie długoterminowej”, podsumowuje Fernandes. „Gwarantuje również, że dane spełniają zasady FAIR (ang. Findability, Accessibility, Interoperability and Reuse), czyli oferują możliwość wyszukiwania, dostępność, interoperacyjność oraz ponowne wykorzystanie”. Dzięki efektywnym procesom wchodzącym w skład metodologii badawczo-rozwojowej projektu, wykorzystaniu przystępnych technologii, skupieniu na ekologii oraz ograniczaniu zasobów wymaganych w celu archiwizacji i przechowywania dużych ilości informacji dane znów nabierają należnego im znaczenia. Świat nauki dostrzegł jednak coś więcej, niż tylko znaczenie danych. Badacze skupieni wokół projektu ARCHIVER otrzymali w 2022 roku nagrodę Digital Preservation Award for Collaboration and Cooperation, przyznaną za doskonałą współpracę w ramach projektu ponad granicami instytucjonalnymi, zawodowymi, sektorowymi i geograficznymi oraz za widoczny wpływ tej współpracy na ochronę zasobów cyfrowych.

Słowa kluczowe

ARCHIVER, dane, archiwizacja danych cyfrowych, badania, archiwizacja, zbiory danych naukowych, długoterminowa archiwizacja danych, oprogramowanie jako usługa, europejska chmura dla otwartej nauki

Znajdź inne artykuły w tej samej dziedzinie zastosowania