- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
详解DNA储存信息:一克DNA相当千亿张DVD光盘
2012年09月07日 07:47 外滩画报微博
哈佛大学研究人员将一本大约有5.34万个单词的书籍编码进不到亿万分之一克的DNA微芯片,然后成功利用 DNA 测序来阅读这本书。
这是迄今为止人类使用DNA遗传物质储存数据量最大的一次实验。
“今后,拇指大小的设备就能存下整个互联网的信息。”该项目的首席研究员、哈佛大学遗传学家乔治·丘奇说。
要说信息存储,没有一样比得过DNA。人们很早就觊觎我们自身的基因代码存储数据的潜力,但如何将信息编码进DNA遗传物质再如何解读出来,一直是个难题。
近日,哈佛大学维斯生物工程研究所的一群研究人员尝试将一本大约有5.34万个单词的书籍编码到不到一沙克(亿万分之一克)的DNA微芯片中,连同文字一起的还有11张图片和一段Java程序。这是迄今为止人类使用DNA遗传物质储存数据量最大的一次实验。“今后,拇指大小的设备就能存下整个互联网的信息。”该项目首席研究员、哈佛大学遗传学家乔治·丘奇(George Church)说,被编码进DNA的书正是他的大作《再生:合成生物学将如何改变未来的自然和自己》。
这项实验被刊登在《科学》期刊上。但因编码存储和读取过程太过昂贵,DNA存储离商业化还有一段距离。“随着DNA合成、测序价格的不断下降,这或许将成为长期存储数据的一种选择。”哈佛大学生物学教授可苏里(Sriram Kosuri)说。这一实验,或许为解决未来社会爆炸性的大数据存储指明了方向。
从二进制到碱基对编码
DNA是生物数据库,它的主要功能就是存储包含各种指令的生物信息。DNA有G(鸟嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四种碱基,共同构成了相互缠绕的双链阶梯状的螺旋结构。通过这四种碱基不同顺序的编码,存储了生物所有的遗传信息。
现代计算机技术奠基者之一冯·诺依曼曾在 1948 年提出“自动复制机器”的设想:一个能够自我繁殖的系统,不仅能够构建某个组成元素,结构和自己一致的下一代,也能够把对自身的描述传递给下一代,如此往复。后来随着生物遗传的奥妙被发现,人们意识到,DNA 双螺旋结构正是冯·诺依曼描述的自动复制机器。
DNA里的四种碱基,两两互补成对。一个最短的DNA分子也有 4000个碱基对,可能的排列方式就有44000种。碱基对排列顺序千变万化,从而能够存储大量的遗传信息。
向活体DNA里写入数据,有诸多困难,细胞会死亡、分裂、变异,数据内容就会发生改变。
在本文开头提到的那项实验中,科学家们没有采用活细胞的基因组,而是采用了人工合成的DNA片段。他们用很多短的DNA序列而非长DNA序列来编码数据,这类似于硬盘写入的原理,在硬盘中,数据是被写入称为扇区的小硬盘块,这样能够降低写入和读取数据的困难和成本。科学家们将这种片段用喷墨打印机嵌入到微阵列芯片表面。接着,他们把计划写入 DNA的书里包含的信息:图片、文字、程序转化为HTML格式的文件,并将这些文件编译为由 0和1组成的电脑能够读懂的2进制数据。然后,他们将2进制数据转为四种碱基,把0转为A或 C,把1转成G或者T,并建立DNA链来维系这些编码的顺序和位置。每一个DNA片段还包含一个数字“条码”,记录它在原始文件中的位置,每个片段被合成多个拷贝以便有助于校正错误。编码完成后,这些芯片会在4摄氏度下保持三个月。
测序就是读取数据的过程:启用DNA测序装置,将所有DNA片断中的编码按照标记顺序排列,再还原成 2 进制格式的数据。每个 DNA 片断的每一个拷贝被测序高达3000次以便校对。利用这种方式,他们将5.27兆数据中的错误降低到只有12个。这种尺寸微小的存储设备,存储密度远远高于DVD、硬盘等介质,效果也毫不逊色。
丘奇认为,和其他生物存储介质相比,DNA存储比较可靠,在室温下也是稳定的,你甚至可以将它放在任何地方,几十万年后,它还在那里。现在的问题是,DNA 存储设备的访问速度很慢,存取和读取都很花费时间,如何覆盖和重写数据也是个问题。好消息是,随着测序技术的进展,DNA 编码和测序的成本会逐年下降,离商业化应用也就不远了。
生物硬盘
在人们把目光投向生物存储之前,占据存储市场主流的就是现在的存储介质,主要是磁盘、光盘。1949年,电脑的磁存储设备问世,意味着信息可以随时存取和控制,这个设备改变了整个行业。一块铝制圆片,涂上磁性介质,因为磁有正负级,在电磁效应作用下,可以方便地存储和表达010101的二进制信息。无论磁盘还是硬盘,基本原理几乎一样。经过60 多年的发展,磁存储行业已经可以在3.5英寸大小的驱动上存储3TB数据。
另一种主流的光存储也在不断挑战存储极限。光盘将数字编码的视频和音频储存在光盘表面的凹槽
文档评论(0)