Група китайських науковців представила незвичний носій інформації: синтетична ДНК, нанесена на довгий пластиковий стрічковий носій, що нагадує магнітну касету. Стрічка завдовжки близько 100 метрів містить молекули, які кодують цифрові файли – від зображень до текстів – і, за оцінками авторів, може вмістити еквівалент мільярдів пісень. Досягнення описано в дослідженні, опублікованому 10 вересня у науковому журналі Science Advances.
Як це працює
ДНК у цьому проєкті не є частиною живого організму: її синтезують у лабораторії, укладаючи нуклеотидні «літери» – аденін (A), цитозин (C), гуанін (G) і тимін (T) – у потрібну послідовність. Подібно до того, як комп’ютерна інформація складається з бітів 0 і 1, послідовності нуклеотидів перекладають у двійковий код і таким чином записують файли.
Отримані ланцюги розчином наносять на полімерну стрічку, де вони адсорбуються на поверхні. Кожен фрагмент стрічки маркований штрихкодом, що вказує, який файл там зберігається. Касето-подібний пристрій із камерою прокручує стрічку між роликами, сканує штрихкод, знаходить потрібне місце і занурює його в простий розчин – ДНК звільняється, її секвенують, а послідовність перетворюють назад у цифровий файл.
Файлова система на молекулярному рівні
Новинка відрізняється від попередніх підходів тим, що демонструє поведінку, притаманну файловим системам: записи можна знаходити, витягувати, замінювати або видаляти. Пристрій працює автономно – без численних ручних операцій – і здатен обслуговувати як «часто запитувані» дані, так і архівні, які рідко відкривають.
Ємність і стійкість – скільки протримається інформація
Автори підрахували, що стрічка довжиною близько одного кілометра може зберігати приблизно 362 000 терабайтів інформації – це близько 60 мільярдів фотографій. Для порівняння: сучасні ноутбуки зазвичай мають 0,5-2 ТБ пам’яті, а смартфони – за замовчуванням 128 або 256 ГБ.
Збереження молекул забезпечують металоорганічні каркаси (MOF) – наномасштабні «клітки», утворені іонами цинку та органічними лігандами. Такі структури захищають ДНК від руйнування, подовжуючи життєздатність записів. Дослідники показали, що стрічка може утримувати дані понад 345 років при кімнатній температурі або приблизно 20 000 років за температури близько 0 °C. Навіть у разі механічного пошкодження стрічку можна відновити прозорою липкою стрічкою, кажуть автори.
Додаткові можливості пристрою
Читач здатний не лише виявляти й вилучати потрібну ДНК: він може інкапсулювати нові молекули в MOF і наносити їх на стрічку, а також автоматично переміщувати фрагменти до правильних за штрихкодом ділянок у разі помилки. Така гнучкість робить систему більш придатною для реального використання, ніж багато лабораторних демонстрацій попередніх років.
Що стоїть на заваді практичному застосуванню
Попри перспективність, серйозні перешкоди залишаються. Синтез ДНК сьогодні – дорогий і трудомісткий процес, що потребує значних лабораторних потужностей. Відновлення одного конкретного файлу зі стрічки займає близько 25 хвилин, тому в теперішньому вигляді технологія навряд чи зможе замінити сучасні хмарні центри збереження оперативних даних.
Водночас це не перша спроба використати ДНК для архівування. У 2016 році інженери Microsoft та партнери зберегли близько 200 мегабайтів інформації у краплі синтетичної ДНК – тоді це називали демонстрацією потенціалу молекулярного архіву. Журнал Science Advances, де опубліковано нинішнє дослідження, є рецензованим виданням, відомим широким спектром робіт у природничих науках; публікація там свідчить про те, що метод пройшов первинну експертну оцінку.
Довідка:
ДНК – це молекула, що містить генетичну інформацію всіх живих організмів, але її синтетичні аналоги дозволяють кодувати й іншу інформацію. Металоорганічні каркаси (MOF) – клас матеріалів зі значною пористістю, які застосовують у каталізі, газовому захопленні та зараз – у збереженні молекул. Великі дата-центри, про які йдеться в роботі, – це індустрія, що обслуговує численні сервіси й споживає значні обсяги енергії й простору; тому компактні й довговічні архіви можуть мати значний вплив на інфраструктуру збереження даних.
Автори сподіваються, що подальший прогрес у дешевшому та швидшому синтезі ДНК, удосконалення автоматизації й прискорення процедур читання зроблять технологію практичнішою для довготривалого зберігання великих масивів інформації.
