Американские учёные сообщили о большом прогрессе в записи и хранении данных на ДНК
Биологические методы записи и передачи информации весьма неторопливые. У природы впереди миллиарды лет эволюции и спешка противопоказана, ведь информацию без критических повреждений необходимо пронести через бездну времени. ДНК оказалась именно таким инструментом для хранения и переноса данных о биологических организмах. Неудивительно, что учёные задумались о том, как можно использовать ДНК для хранения любой информации.
Ранее Агентство передовых исследований в сфере разведки США (Intelligence Advanced Research Projects Activity, IARPA) запустило программу MIST (молекулярное хранение информации). В рамках программы выделился проект SMASH (Scalable Molecular Archival Software and Hardware). Контракт по программе SMASH был заключён с Институтом технологических исследований штата Джорджия (GTRI). Программа предусматривает разработку полупроводниковых платформ (чипов) для записи и считывания данных с ДНК.
По программе SMASH вместе с учёными из института из Атланты работают компании Twist Bioscience и Roswell Biotechnologies, а также Вашингтонский университет и компания Microsoft. Как сообщило сегодня информагентство BBC, учёные доложили о большом прогрессе в записи и хранении данных на ДНК. По словам разработчиков, они смогли нащупать возможность в 100 раз повысить плотность записи на ДНК по сравнению с актуальными решениями. В перспективе, например, это может позволить записать все фильмы в истории человечества в объёме одного кубика сахара.
Для записи данных на ДНК может использоваться не двоичный код, а кодирование из четырёх базовых символов, что резко повышает плотность записи в сравнении с записью с использованием двоичного кода. Как известно, нить ДНК содержит последовательности из четырёх оснований нуклеиновых кислот: аденина (A), гуанина (G), цитозина (C) и тимина (T). К примеру, для кодирования можно представить основания следующим образом, где 00 = A, 01 = C, 10 = G, а 11 = T. Закодированные этими кислотами данные записываются в ДНК и упаковываются для сохранения в небольшой контейнер. При низкой температуре ДНК и записанные на неё данные могут сохраняться тысячелетия почти без повреждения.
Проблема с записью данных в ДНК заключается в низкой скорости синтеза и такой же низкой скорости секвенирования. Кроме того — это дорого. На синтез ДНК с записью 200 Мбайт данных у учёных уходит до 24 часов. Поэтому задача стоит упростить, ускорить и снизить стоимость этапов записи и чтения, чему поможет размещение ДНК на чипах. Учёные из GTRI придумали и реализовали один из таких подходов с одним важным усовершенствованием. Они научились синтезировать одиночные нити ДНК параллельно во многих ячейках сразу. И чем больше будет таких ячеек, тем быстрее будет идти запись и тем выше будет плотность записываемой информации.
В новом году исследователи планируют вооружить чип для синтеза ДНК электронной обвязкой для ускорения процессов и полной их автоматизации. В перспективе это может позволить отказаться от магнитных лент для долговременного хранения данных. Ленты приходится обновлять каждые 10 лет, а данные на ДНК могут храниться сотни и тысячи лет без обновления.