(4.75)--将全世界数据存到DNA 1公斤就够.doc

(4.75)--将全世界数据存到DNA 1公斤就够.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

将全世界数据存到DNA1公斤就够

数据不仅可以存在硬盘里,还可以存在生物的DNA里。1公斤重的DNA,就可以存下全世界的数据信息。

科学家将“HelloWorld”翻译成碱基语言,储存到大肠杆菌的DNA中。|改编自ChemistryWorld

文?|汤波分子生物学博士

本文转载自微信公众号“十点科学”(ID:Science_10),原文首发于2021年1月22日,原标题为《将数据存到DNA里!全世界的信息只有1公斤重》,不代表瞭望智库观点。

大数据时代,我们在网络上每一个动作,比如网上冲浪、观看视频,甚至跑步、走路等日常行为,每分每秒都在产生大量数据。它们如一条条河流,汇聚成数据的汪洋大海。

如此大量的信息如何存储?珍贵的数字记忆要如何长久可靠地保存?科学家们想到了一种方法,将数据写入活细菌的DNA中!

最近,美国哥伦比亚大学的研究人员通过改变环境电压,引导“基因魔剪”CRISPR-Cas系统,将“helloworld”翻译成碱基语言,录入大肠杆菌的DNA中。在繁衍80代以后,这些大肠杆菌体内储存的数据仍然基本完好无损。

相关研究发表在1月11日的《自然·化学生物学》杂志。

1

数据时代,存储的革新

在地球生命系统中,DNA可谓无处不在。自然将生命的遗传信息存储在DNA中,人类也可以将数据信息存储其中。

计算机的二进制语言只需要0和1两个符号,即可编码所有信息。生命的本质也是一种语言,那就是由A、T、C、G四种碱基串联而成的DNA,四种碱基的顺序蕴藏着生命的信息。

早在上世纪80年代末,就有人提出,或许可以将计算机的二进制数字语言转换成DNA的四种碱基语言,从而将数据信息存储在DNA上。读取时只要反向进行DNA测序即可。

数据信息可以存储在DNA中,也可以反过来从DNA中读取数据信息。|来自网络

相比于人类津津乐道的硅,DNA简直是数据存储的理想载体。首先,DNA的存储密度非常大。如果我们能够像大肠杆菌那样包装DNA,那么全世界的数据信息都可以储存在1公斤重、只占粉笔盒大小空间的一堆DNA中。

其次,一般物理存储设备使用寿命往往不到10年,DNA则可将遗传信息完整保存100年以上;如果是在零下18℃以下的低温环境中,甚至可保存上万年、数十万年。

第三,DNA存储过程耗能极少。要存储同样大小的信息,DNA的耗能量只相当于闪盘的亿分之一。

2

人工合成DNA带来希望

在实际操作中,二进制数字语言要如何转换成DNA的四种碱基语言呢?2012年,哈佛大学遗传学家乔治·丘奇团队确立的规则是,用碱基A、C编码二进制的0,G、T编码二进制的1。

经过简单翻译,一本包含大约5.34万个单词的书籍、11张JPG图片、一段简短的计算机程序,全部被编码进不到亿万分之一克的DNA微芯片中。这些文件大小相当于659千字节。之后,研究人员利用DNA测序技术成功阅读了这本书,虽然略有瑕疵地发现了22个错误。

几个月后,欧洲生物信息研究所采用另一种策略,同样将大小为739千字节的文件写入人工合成DNA中,读取正确率接近100%。

这两项研究让人们看到了DNA存储技术的希望,也开启了研发热潮。之后,存储数据的大小不断突破上限,从22兆字节,到200兆字节,再到维基百科所有16GB的数据。

DNA数据存储设备。|Takahashietal,2019

不过,人工合成DNA数据存储技术要实现商业化应用,还有一些重大问题要解决。

一是成本过高,目前人工合成存储1兆字节数据的DNA,需要3500美元,解码过程还需要额外的1000美元。二是无论存储还是读取过程都需要专业设备,个人使用极不方便。三是DNA保存需要低温环境,否则长时间容易发生DNA降解,导致数据失真或丢失。

3

活细菌蕴藏着新可能

既然人工合成DNA有缺陷,那能不能借用活细菌的DNA呢?比如大肠杆菌,在实验室只需要少量的营养物质就能茁壮成长,成本应该也会低很多。

事实上,早在2017年,丘奇团队就开创性地利用“基因魔剪”CRISPR–Cas技术,将编码信息的DNA片段送入细菌体内。CRISPR–Cas系统可以对任何DNA序列进行精准修改,如将碱基A替换成碱基G,或者删除、插入、替换一段特异的DNA序列,就像我们使用Word软件编辑文字一样。

实验中,丘奇团队将一些黑白图像和一张飞驰骏马动图编码为DNA序列,插入大肠杆菌的基因组中。在大肠杆菌经过多代繁殖后,研究人员仍然能够还原动图信息,正确率达90%以上。

左边是飞驰骏马动图的原图,右边是将该动图存储在活细菌中,并经过多代繁殖后恢复的动图。?|SETHSHIPMAN

这一次,哥伦比亚大学的研究人员则进一步发展了该方法。他们用电化学方法调控CRISPR系

文档评论(0)

158****6446 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档