分子生物学研究法-基因功能研究技术中.doc

分子生物学研究法-基因功能研究技术中.doc

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 分子生物学研究法 (下)基因功能研究技术 随着越来越多的基因组序列相继被测定,人类对生物本质的认识已经发生了重大变化。但是,海量序列信息也向我们提出了新的挑战。如何开发利用这些序列信息,如何通过生物化学、分子生物学等方法研究基因的功能,从而进一步了解生物体内各种生理过程,了解生物体生长发育的调节机制,了解疾病的发生、发展规律,给出控制、减缓甚至完全消除人类遗传疾病,是新时期生物学家所面临的主要问题。转录组测序技术. 1 基因表达研究技术 6. 1. 1转录组6.1.1 转录组分析和RNA-Seq 转录组(transcriptome),广义上指在某一特定生理条件或环境下,一个细胞、组织或者生物体中所有RNA的总和,包括信使RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)及非编码RNA(non-coding RNA或sRNA);狭义上特指细胞中转录出来的所有mRNA的总和。基因组-转录组-蛋白质组(genome-transcriptome-proteome)是中心法则在组学框架下的主要表现形式。通过特定生理条件下细胞内的mRNA丰度来描述基因表达水平并外推到最终蛋白质产物的丰度是目前基因表达研究的基本思路。 转录组研究的基本方法包括基因芯片技术(gene chip)和转录组测序技术。我们将在6.4节详细叙述基因芯片技术,这里主要讨论转录组测序技术的原理和应用。 基于传统的Sanger测序法对转录组进行研究的方法主要包括:表达序列标签(expressed sequence tag,EST)测序技术,基因表达系列分析技术(serial analysis of expression,SAGE)。EST测序数据是目前数量最多,涉及物种最广的转录组数据,但测序读长较短(每个转录本测定400 bp-500 bp),测序通量小,测序成本较高,而且无法通过测序同时得到基因表达丰度的信息。有人使用SAGE测序法,将不同转录本3’端第一个CATG位点下游14 bp长的短标签序列来标识相应的转录本。由于标签序列较短,可以将多个标签串联测序,使SAGE法相对于EST测序在通量上大大提高。但过短的序列标签使得序列唯一性降低,即使改进过的LongSAGE用21 bp标签测序,仍然有约一半的标签无法被准确注释到基因组上。 高通量测序技术(high-throughput sequencing),又名二代测序(second-generation sequencing)或深度测序(deep sequencing),可以一次性测序几十万甚至几百万条序列,是传统测序技术的一次革命。主要有Roche公司研发的454测序平台和Illumina公司的Solexa测序平台(表6-1)。 表 6-1 454和Illumina高通量测序平台比较 454 Illumina 读取长度(bp) 约700 50-150 单次测序数据量 700 Mb 600 Gb 测序周期 23小时 7-14天 测序成本 较高 低 虽然都是基于“边合成边测序(sequencing by synthesis,SBS)”,但是454和Illumina的实现方法有很大的不同。454系统采用焦磷酸测序(pyrosequencing)原理,如图6-1a所示,在DNA 聚合酶的作用下,按照T、A、C、G顺序加入的单个dNTP与模板的下一个碱基配对,同时释放一个分子的焦磷酸(PPi),在ATP硫酸化酶的作用下,PPi和腺苷酰硫酸(adenosine-5’-phosphosulfate,APS)结合形成ATP,在萤光素酶的催化下,ATP和萤光素结合形成氧化萤光素,产生可见光,被CCD捕捉。而Illumina系统(图6-1b)采用带有萤光标记的dNTP,其3’羟基末端带有可被化学切割的部分,每个循环反应只允许掺入一个碱基,由激光扫描反应板表面,读出这一轮反应新加的萤光信号,从而判定碱基种类。之后,经过化学切割恢复3’端粘性,进行下一轮聚合反应。从上述描述中不难看出,随着反应的进行,已有萤光信号会使新的荧光难以准确分辨,因此该方法的测序读长较短,测序错误主要是碱基替换。而454则由于缺少终止反应的元件,相同碱基的连续掺入常会带来“插入-缺失”类型的测序错误。 利用高通量测序技术对转录组进行测序分析,对测序得到的大量原始读长(reads)进行过滤、组装及生物信息学分析的过程被称为RNA-Seq。对于有参考基因组序列的物种,需要根据参考序列进行组装(reference assembly),对于没有参考序列的,需要进行从头组装(de novo assembly),利用大量读长之间重叠覆盖和成对读长(pair-end reads)的相对位置关系,组装得到尽可能完整的转录本,并以转录本上覆盖的读长

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档