В последние годы ученые расшифровали геном мамонта и лошади возрастом 700 000 лет, с использованием фрагментов ДНК, извлеченных из ископаемых. ДНА, конечно, не устраняется очень долго, организмов, из которых она несет в себе генетические коды. Компьютерные ученые и инженеры давно мечтают обуздать миниатюрные и стабильность ДНК для хранения цифровых данных. Они хотят, чтобы закодировать все эти нули и единицы в молекулы, E, C, G и T, которые образуют винтовой лестнице полимера ДНК, и достижение это десятилетие в области синтеза и секвенирования ДНК привело к серьезным инновациям. Недавние эксперименты показали, что когда-нибудь мы будем в состоянии кодировать всей цифровой информации в мире в несколько литров ДНК и прочитать снова через тысячи лет.
Интерес со стороны Microsoft и других технологических компаний увеличивает напряжение в этой области. В прошлом месяце Microsoft Research, сказал, что оплатит винт запуска в области синтетической биологии Twist Bioscience определенную сумму, чтобы создать 10 миллионов цепей ДНК, разработанной учеными компьютерные Microsoft для хранения данных. Ведущий производитель памяти Micron Technology также финансирует исследования хранилища данных ДНК, чтобы определить, является ли система на основе нуклеиновой кислоты расширить пределы памяти электроники. Это приток денежных средств и объектов может постепенно уменьшить непомерные расходы и сделать хранение данных в ДНК может через десять лет, говорят исследователи.
Человек, т. е. более 16 млрд гигабайт цифровых данных к 2017 году, и большая часть этого будет необходимо выполнить резервное копирование. Юридических, финансовых и медицинских данных, а также, конечно, мультимедийных файлов. Сегодня данные хранятся на жестких дисках, оптические диски высокой интенсивности использования энергии в дата-центр размером с складе. В лучшем случае эти данные хранятся тридцать лет, в худшем — несколько. Кроме того, как говорится в компьютерной архитектор Microsoft Research Кэрин Штраус, «мы производим гораздо больше данных, которые удается промышленности для производства устройств для их хранения, и прогнозы показывают, что этот разрыв будет расти».
И теперь добавляем все это в ДНК. Он живет века, если держать ее в прохладном и сухом месте. Теоретически с его помощью вы можете упаковать млрд гигабайт данных в объеме кубика сахара. Магнитная лента, плотнейшая современных условия хранения, подходит для иностранцев 10 гигабайт в том же объеме пространства. «ДНК-это невероятно плотного, прочного и энергонезависимый носитель данных», — говорит Ольгица Миленкович, профессор электрической и компьютерной инженерии в Университете штата Иллинойс в Урбана-Шампейн.
Все потому, что каждая из четырех молекул аденина (A), цитозин (C), гуанин (G) и тимин (Т) — берет кубик nm объем. С помощью системы кодирования — например, в которой И представляет битов «00», C «01» и так далее — ученые могут принять в ряды нулей и единиц, образующих цифровые файлы с данными, и создать цепочку ДНК, содержащий фото или видео. Конечно, настоящим методом кодирования гораздо более трудно, что мы здесь написали. Резюме дизайн цепи ДНК-это процесс записи данных. Тогда ученые могут читать, секвенируя цепи.
Генетик Гарвардского университета Джордж Черч основал это поле поиска в 2012 году, после 70 млрд экземпляров книг — миллион гигабит — кубический миллиметр ДНА. Спустя год, ученые Европейского института биоинформатики показали, что могут читать без ошибок, 739 кб данных, заключенных в ДНК.
В прошлом году несколько команд ученых показали, полностью функционирующей системы. В августе ученые E. T. H Zurich инкапсулировали синтетической ДНК в стекло, термины, формируя срок в 2000 лет, и полностью перестроен закодированные данные. Параллельно с этим, Миленкович и его коллеги сообщили о сохранении страниц из Википедии силами шесть американских университетов в ДНК — последовательности, обеспечивая специальные «адреса» — выборочно читать и редактировать текст написал. Случайный доступ к данным очень важен, чтобы избежать необходимости «упорядочить всю книгу, чтобы прочитать только один абзац», — говорит Миленкович.
В апреле Стросс и ученые Джордж Силиг и Луис Цезе из Вашингтонского университета сообщили, что смогли записать три файла изображения, каждый в несколько десятков килобайт, до 40 000 цепочек ДНК, используя схему кодирования, и после того, как рассматривается индивидуально, без ошибок. Работа, которую представила в апреле на конференции Ассоциации для электроники-информатики. С помощью 10 миллионов цепей, что Microsoft покупает Twist Bioscience, ученые намерены доказать, что данные ДНК можно хранить в гораздо более крупных масштабах. «Наша задача — продемонстрировать целевой системы, в которой мы кодируем файлы ДНА, синтезируем молекулы, храним их в течение длительного периода времени, а затем восстанавливаем, секвенируя ДНК, — сказал Стросс. — Давайте начнем с бит и вернемся к бит».
Производитель памяти Micron изучает ДНК, как посткремниевой технологии. Компания финансирует работу Церкви и ученые Университета штата Айдахо, чтобы создать безошибочную систему хранения данных в ДНК. «Повышение стоимости хранения данных будет стимулировать альтернативные решения, и сохранение ДНК является одним из наиболее перспективных решений», — говорит Гуртей Sandhu, директор отдела развития новых технологий в Микрон.
Ученые до сих пор ищут способы, чтобы уменьшить количество ошибок кодирования и декодирования данных. Но основные технологии уже в поле. Так что же мешает нам перейти от хранилищ данных размером с коробку для обуви в стеклянных капсул с ДНК? Цене. «Процесс регистрации в миллион раз дороже», — говорит Силиг.
И вот почему: создание ДНК включает в себя продевать нитку молекул наноразмерных один за другим с высокой точностью — задача не из легких. И даже если стоимость секвенирования снизилась в связи с быстрым развитием спроса на эту услугу, синтез ДНК не имел этот драйвер на рынке. Миленкович заплатил около 150 долларов, чтобы создать серию 1000 синтез нуклеотидов. Последовательности миллионов нуклеотидов стоит около копейки.
Интерес к сохранению данных с Microsoft и ibm может быть только то импульс, что нужно, чтобы начать сокращать расходы, говорит Силиг. Смарт инжиниринг и новые технологии, такие как микрофлюидики и нанопорового секвенирования ДНК, которые помогают уменьшить и ускорить процесс, а также будет способствовать. Теперь уходит несколько часов, чтобы упорядочить несколько сотен пар нуклеотидов — и дней на их синтез, используя много оборудования. Я хотел бы провести все это в небольшой коробке, в противном случае преимущество плотности хранения данных будет потеряно.
Если все пойдет хорошо, Стросс представь, что появление компаний, которые предлагают услуги хранения в хранилище ДНК в течение следующего десятилетия. «Вы будете в состоянии открыть браузер и загрузить файлы на их сайте или вывести байт, снова, как и в облаке», — говорит он. Или можно будет купить диск ДНК вместо жесткого диска.
Когда-нибудь мы будем в состоянии закодировать всю информацию в мире в течение нескольких литров ДНК
Илья Хель