网站大量收购独家精品文档,联系QQ:2885784924

DNA测序技术的宿世今生.doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DNA测序技术的宿世今生

解读生命密码的基本手段 ——DNA测序技术的前世今生 任鲁风??于军 (中国科学院基因组科学及信息重点实验室,北京基因组研究所) ? DNA(脱氧核糖核酸)和RNA(核糖核酸)是生命体的两种最基本组成物质,其序列的组成和变化造就了形形色色的生命世界。这两种承担了生命体遗传信息载体功能的物质,一方面在生命的不断繁衍中保持了各个物种的独特面目,另一方面又通过不断的演变改变着自身性状,同时又影响着与之相关的物种,这一规律在生命科学领域被归纳为“中心法则”。笼统而言,几乎全部的生命现象均来源于A、T、C、G这四种碱基的排列顺序(在RNA序列中,U取代了DNA序列中的T)及其变化,并且,这种排列并非无序的随机组合,而是具有相当丰富的信息含量、生命内涵和变化规律性。所以,DNA和RNA序列被称之为生命密码是完全合情合理的,有效而准确地获取这些密码,成为生命科学研究的基本信息获得手段和赖以发展的根本基础。 ? DNA序列是如何测定的? 1975年英国生化学家Frederick Sanger发明了末端终止法DNA测序技术,打开了我们解读生命天书的大门,人们第一次真正看到了生命的最基本信息是什么样子,所谓的基因到底包含了哪些内容。随着了解的信息逐渐积累,量变产生了质变,我们得到了一些规律,而随之而来的却是更多的问题和困惑,研究工作愈加深入,我们就会发现自己的了解愈加贫乏。这就像战争催生技术革命一样,需求总是技术发展的源动力,从而日新月异的信息获取手段——测序技术——获得了长久不衰的发展,其过程就是序列获得→原理发现→了解深入→疑问产生→寻求答案→更多的序列获得需求→新技术产生→更多序列的获得→更深入的了解和更深入的疑问,正是这样周而复始的螺旋上升过程,推动了生命科学进入高速发展的轨道。 在这样的科学技术发展过程中,我们对序列获取的需求从最初的某一个基因的解析逐渐演化成对全部基因的解析、对基因组的解析、对转录组的解析、对DNA修饰的解析、对转录调控的解析、对RNA修饰的解析等等方方面面的需求和实践。应运而生的是自动化测序、高通量测序、RNA测序、甲基化测序等等技术变革甚至革命,其中最显著的就是测序设备通量的飞速发展,至今为止每天每台能够产生的测序数量已经从最初的几千个碱基(1985年)达到了25~30G(1G=109)个碱基,特别是近5年的进展,几乎可以用IT行业的摩尔定律来进行描述。可以说,目前对于最基本的DNA和RNA测序,除了价格因素外,基本可以满足科学研究的需要了。 既然说需求已经可以满足了,为什么还要发展测序技术呢? ? 能够测什么,还需要测什么? 经过几十年来的研究和积淀,人们对生命信息的理解从最初认识到的DNA和RNA,不断的进行丰富。在上个世纪80年代开始启动人类基因组计划之际,人们还在认为拿到人类的全部基因组序列就可以解读这部天书,但实际上这仅仅是一个开始,在这个当时比肩于阿波罗登月计划的项目进行中,我们就发现生命的信息远远超出当时的认知范围。占基因组多达1%的多态性位点、基因组中的非编码序列、种类繁多的各类不同功能的RNA、不同基因序列上的甲基化位点、DNA和蛋白相互作用的调控机制等等,诸如此类庞杂的信息以及深深隐遁其中的生命规律远不是测定一个基因组就可以解决的问题。 为了发现多态性位点和性状表现之间的关系,需要对大量样本进行重测序,才能从中总结规律;为了发现不同基因的不同甲基化程度,需要进行甲基化测序(通过亚硫酸氢钠处理DNA,使非甲基化的C变成U,测得序列中的C就是甲基化位点);为了发现不同组织中基因的转录水平,需要进行转录组测序(mRNA逆转录成cDNA,再进行测序)。从表面上看我们已经找到了应对各种需要的测序技术,实际上却不尽然。 对于DNA测序而言,目前的高通量测序技术在满足通量的同时,由于技术本身的限制,读取的单一序列长度一般介于75~100个碱基(Life Technologies公司的5500xL SOLiD测序仪和Illumina公司的HiSeq2000测序仪),Roche公司的454 GS FLX测序仪可以达到500碱基的读长,相应的其通量仅仅为0.5G碱基,通量价格比远低于前两者(通量分别为180G和200G)。这样就形成了一个瓶颈,通量高的读长短,读长长的通量低。 为什么我们要追求通量和读长?通量高可以让我们用更少的时间和更低的价格获得更多的数据;而读长则决定了对获得的序列片段进行拼接的难度。对于人类基因组重测序这样的工作,因为我们已经有了绝大部分都一致的参考序列,短读长片段可以很容易的通过比对找到相应的位置,但对于一个从来没有测过序列的物种,只能通过片段之间的相同序列来排定顺序,短读长就力不从心了。虽然我们开发了无数算法和软件来进行这项工作,但读长的局限性依然很大程度上存在。 另外,由于基因组中还存在

文档评论(0)

yxutcangfp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档