Скорость чтения-записи ДНК разогнали до 1,9 бит/час

Ученые Вашингтонского университета (США) и корпорации Microsoft смогли записать данные на ДНК, как на какой-нибудь цифровой носитель. Они автоматизировали процедуру кодирования цифровых данных в «генетический алфавит» и потратили на запись в ДНК слова hello и его чтение 21 час.

Нить ДНК

ДНК — очень компактное и долговечное хранилище информации. Один миллилитр ДНК может уместить до миллиарда гигабайтов информации, которая может храниться тысячи лет, — сегодня ученые расшифровывают геномы палеонтологических находок, которым десятки тысяч лет. Другие же ученые занимаются не чтением, а записью информации в ДНК. Пока что рекорд объема данных, которые удалось втиснуть в ДНК той же самой исследовательской группе, — 200 мегабайт. Процесс записи до недавнего времени выглядел так: сначала информацию в виде двоичного кода из единиц и нулей переводили на «азбуку жизни» азотистых оснований (А, Т, Г, Ц), затем синтезировали ДНК с такой последовательностью. А чтобы считать информацию с ДНК, последовательность секвенировали, а затем снова переводили в двоичный код. При этом каждый шаг производился отдельно, что занимало массу времени и вообще не было похоже на использование обычного хранилища файлов.

Как сказал один из авторов статьи, «вокруг дата-центра не должны бегать люди с пипетками». Поэтому ученые автоматизировали систему и создали комплекс, внутри которого происходят все стадии процесса.

Выглядит он так:

Установка для записи, хранения и чтения информации с ДНК© Christopher N. Takahashi et al. / Scientific Reports / CC BY 4.0Установка для записи, хранения и чтения информации с ДНК
© Christopher N. Takahashi et al. / Scientific Reports / CC BY 4.0

Чтобы апробировать свою установку, ученые перевели слово Hello в двоичный код, получив последовательность размером 5 байтов (01101000 01100101 01101100 01101100 01101111), а затем перевели его в четверичный код, в котором А был нулем, Ц единицей, Г = 2, а T = 3. После этого установка синтезировала ДНК в соответствующей последовательности. Всего насинтезировали 1 миллиграмм ДНК, из которого в секвенатор по специальному насосу отправилось 4 микрограмма.

Система расшифровывает ДНК нанопоровым секвенированием. В этом методе используется тонкая мембрана всего в полтора нанометра толщиной, в которую встроены белки-поры. Мембрана делит пополам камеру с раствором электролита, в котором плавает ДНК. Когда через систему подается ток, ДНК, которая заряжена отрицательно, ползет к «плюсу», по ту сторону мембраны. По дороге она  протискивается через поры, и азотистые основания, из которых она состоит, затыкают дырку. Ручеек ионов электролита, который тоже течет через пору, становится уже, и сила тока, текущего через мембрану, падает. Разные нуклеотиды имеют разную форму и в разной степени затыкают проход, поэтому по снижению тока можно определить, какой именно нуклеотид сейчас лезет через пору.

Секвенаторы такого типа позволяют расшифровывать очень длинные куски ДНК, до 100 000 пар оснований. Правда, точность у них ниже, чем у лучших секвенаторов других типов, — количество ошибок может доходить до 10%. Зато стоят они от 1000 долларов, размером меньше смартфона и работают быстро — у авторов статьи процесс расшифровки занял шесть минут. Весь остальной процесс не был таким же быстрым. На всё про всё ушел 21 час, причем львиную долю времени занял синтез ДНК.

Как пишут ученые, 5 байтов за 21 час пока нельзя назвать коммерчески жизнеспособными показателями. Тем не менее прежние технологии хранения данных тоже начинали с не очень впечатляющих результатов. Сейчас ученые собираются уменьшить время синтеза ДНК, а также сделать многократными запись и считывание информации.

Источник: chrdk.ru

Метки , , . Закладка постоянная ссылка.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *