Skip to main content

Article Category

Wiadomości

Article available in the folowing languages:

WYZNACZANIE TRENDÓW W NAUCE: Przechowywanie wszystkich danych świata w kubku do kawy

Naukowcy zamierzają przechowywać dane cyfrowe w postaci DNA.

Badania podstawowe

Dane są wszędzie. Nasz cyfrowy wszechświat zawiera około 10 bilionów gigabajtów danych. Codziennie wytwarzamy kolejne 2,5 miliona gigabajtów danych w postaci wiadomości e-mail, zdjęć, tweetów i innych plików cyfrowych. Liczby te raczej nie zmaleją. Większość tych informacji jest przechowywana w dużych eksabajtowych centrach danych, których budowa i utrzymanie kosztuje 800 mln EUR.

DNA jako nośnik danych?

Istnieje inna metoda przechowywania ogromnych ilości cyfrowych treści. DNA zawiera wszystkie informacje genetyczne – przechowywanie tak dużych ilości danych jest możliwe dzięki jego wysokiej gęstości zapisu. Pomysł na wykorzystanie DNA do przechowywania cyfrowych danych nie jest nowy – po raz pierwszy pojawił się po koniec lat 50. XX wieku. Możliwości praktycznego zastosowania tej koncepcji były jednak mocno ograniczone. Wszystkie dane cyfrowe, takie jak zdjęcia, nagrania audio, dokumenty i inne pliki, można by przechowywać w jednym miejscu w postaci DNA. Mówiąc dokładniej, ilość DNA potrzebna do wypełnienia kubka do kawy mogłaby teoretycznie pomieścić wszystkie dane istniejące na Ziemi. Według czasopisma „Nature Materials” naukowcy z Massachusetts Institute of Technology (MIT) i Uniwersytetu Harvarda opracowali technikę znakowania i odczytu plików danych DNA. Osiągnięcie to może ułatwić przechowywanie danych z użyciem DNA. „Potrzebne są nowe sposoby przechowania ogromnych ilości danych, które gromadzi ludzkość, szczególnie danych archiwalnych”, skomentował Mark Bathe, współautor badania i profesor inżynierii biologicznej z MIT, w artykule prasowym opublikowanym przez tę uczelnię. „DNA cechuje się gęstością zapisu tysiąc razy większą niż pamięć flash, a kolejną interesującą jego właściwością jest fakt, że po zakończeniu polimeryzacji nie zużywa już energii. Informacje można zapisać w DNA i przechowywać przez nieograniczony czas”. Społeczności naukowej już wcześniej udało się zademonstrować możliwość zakodowania obrazów i stron tekstu w DNA. Nowa technika polega na umieszczeniu plików zapisanych w DNA w cząsteczkach krzemionki znakowanych DNA. Zespół badaczy z MIT jest w stanie zapisać zestaw 20 obrazów w postaci sekwencji DNA, a następnie precyzyjnie odczytywać pojedyncze obrazy. Górny limit tej nowatorskiej metody to 10²⁰ plików.

Oczekiwanie na spadek cen

Zapis danych w DNA jest bardzo stabilny i prosty, jednak synteza i sekwencjonowanie są niezwykle kosztowne. Aby zapisać jeden milion gigabajtów danych, trzeba wydać ponad 800 mld EUR. Koszt syntezy DNA musi zmaleć o około sześć rzędów wielkości, co według przewidywań powinno nastąpić w ciągu następnych dziesięciu lub dwudziestu lat. „Jeśli synteza DNA stanie się wystarczająco tania, będziemy w stanie maksymalnie zwiększyć ilość danych, które można zapisać w jednym pliku z użyciem naszej metody”, powiedział James Banal, główny autor badania i starszy badacz z MIT. George Church, profesor genetyki z Harvard Medical School, który nie brał udziału w badaniu, opisał tę technikę jako „ogromny krok w dziedzinie zarządzania wiedzą i technik wyszukiwania”. Po czym wyjaśnił: „Gwałtowny rozwój zapisu, kopiowania, odczytu i energooszczędnej archiwizacji danych w postaci DNA przyniósł słabo zbadane możliwości precyzyjnego odczytywania plików z ogromnych, zettabajtowych (10²¹ bajtów) baz danych. W nowym badaniu zajęto się tą kwestią, osiągając spektakularne wyniki: zastosowano całkowicie niezależną zewnętrzną warstwę DNA, wykorzystano inne właściwości DNA (hybrydyzację, a nie sekwencjonowanie), a ponadto użyto istniejących narzędzi i procesów chemicznych”. Zrewolucjonizowanie tego sposobu przechowywania i archiwizowania danych może wydawać się zbyt odległe, jednak nie tak dawno myśleliśmy pewnie tak samo o takich nośnikach danych, jak pamięci USB i płyty CD.

Słowa kluczowe

DNA, dane, plik, pamięć, przechowywanie danych, cyfrowe, gigabajt