- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
转录组测序到底在做什么 (⼀)
转录组⼴义上指在特定环境 (或⽣理条件)下,⼀个或⼀群 胞中所转录出的所有RNA 的总和,包括信使
RNA(mRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)及⾮编码RNA ;⽽我们通常所说的转录组则特指mRNA 的集合。
随着⼆代测序价格的不断下降及⽣信分析技术的不断进步,转录组测序被⼴泛的应⽤于⽣物学研究的⽅⽅⾯⾯。⽽“测
个序吧”也成了研究者在缺乏明确⽬标的情况下筛选后续研究⽅向的⼀个省时省⼒,且经济实惠的⼿段。即使在⽬前组
学研究突飞猛进的情况下,经典转录组也依然占据着极重要的地位。然⽽,对于⼀些对⼆代测序技术了解不多的研究者
⽽⾔,想使⽤这个⽅便⽽强⼤的⼯具依然有⼀定的门槛。
那么,转录组测序到底在做什么呢?到底能做什么呢?实验⽅案设计上⼜有哪些讲究呢?下⾯就跟随⼩微理清转录组测
序的⽅⽅⾯⾯,为您的研究课题提供⼀个强有⼒的⼯具。
其实早在2016年,佛罗⾥达⼤学、加州⼤学等的研究⼈员就在Genome Biology上发表了题为“A survey of best
pra ti es for RNA-seq data analysis”的review ,对经典转录组测序及数据分析作了 致的介绍,⽬前该综述的累计引⽤
次数已经接近700次,⾜见转录组测序的⽕爆程度。我们可以将⼀个完整的转录组测序的实验流程分为了三部分 (图
⼀)。
第⼀部分是前期分析部分,包括对实验⽅案的设计、测序⽅案的设计、以及测序数据的质控。第⼆部分则是核⼼分析,
包括转录组测序整体评估,基因差异表达分析及功能分析。第三部分是⾼级分析,这部分需要针对特定的实验⽬的和需
求进⾏选择,如转录因⼦的分析、融合基因分析、与其他组学的联合分析等。
图⼀
前期分析
转录组测序的根本⽬的在于回答特定的⽣物学问题,因此⼀个良好的实验⽅案的设计是其根本。其中,⽣物学重复的数
量、⽂库类型及测序深度等因素直接关系到结果的好坏。在这⾥要尤其强调⾄少三个以上的⽣物学重复的重要性。三个
以上的⽣物学重复是进⾏任何可信的下游数据的统计分析的基础,过少的⽣物学重复或者没有重复将使分析结果的可信
度⼤⼤降低。
⽽由于转录组情况的复杂,选择合适的⽂库类型也显得极为重要。⽂库的选择⼀般考虑两个问题:
01、如何获取mRNA⽚段?
真核⽣物成熟的mRNA⼀般带有polyA尾巴,因此常规的转录组建库流程中通常直接对具有PolyA尾巴的⽚段进⾏捕获,
这样可以得到纯度较⾼的mRNA。但是这样的⽅式对于mRNA 的完整度要求较⾼,发⽣降解的样本使⽤这种建库⽅式会
损失⼀定的转录组信息。另⼀种获得mRNA 的⽅式则去除在Total RNA 中占⽐最⾼的rRNA (通常占⽐超过90%以上),
⽽剩下的RNA 中就包括了mRNA (占⽐为1-2%),这种⽅式对降解样本的耐受度相对较⾼,但需要更⾼的测序数据
量,且成本也更⾼。原核⽣物由于其mRNA不具有PolyA尾巴,因此只能选择rRNA去除的⽅式。
02、是否构建链特异性⽂库?
由于RNA为单链,但普通的转录组⽂库会同时测到模板链及其反向互补信息,不但⽆法判断原始的mRNA 的⽅向,同时
也会对转录本的定量的准确性产⽣⼲扰。⽽链特异性⽂库则可以在建库过程中将反向互补序列的⽂库直接消化掉,不仅
保留了原始的mRNA 的⽅向,同时也提⾼了定量的准确性。
微分基因所有的转录组产品 (包括真核有参转录组、真核⽆参转录组、原核转录组)均已全⾯升级为链特异性⽂库。
另⼀个重要的因素就是测序数据量的⼤⼩ (即测序深度)。但是最佳的测序数据量并没有⼀个固定的值,⽽会因为⽬标
另⼀个重要的因素就是测序数据量的⼤⼩ (即测序深度)。但是最佳的测序数据量并没有⼀个固定的值,⽽会因为⽬标
转录组的复杂度的不同⽽不同。⼀些⼈认为5M 的mapped reads ⾜够对转录组中的中度及⾼度表达的转录本进⾏精确定
量了。但是对低丰度的转录本的定量则需要更⾼的测序深度,⽽过⾼的测序深度所带来的转录本的噪声也可能影响定量
的准确性。在对转录组的整体评估中,饱和曲线可以较好的评估测序深度是否合适。
通过对以上这些实验设计因素的控制后通过测序就得到了测序数据。我们还需要对原始数据(RAW data) 进⾏质控,包
括对低质量的测序数据的去除,接头序列的去除,rRNA 序列的去除等。经过质控过滤后得到的数据( lean data) 才能进
⾏后续的分析。同时,也可以通过碱基分布、Q20 、Q30 、rRNA ⽐
文档评论(0)