《录组测序以及常用算法简介.docxVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《录组测序以及常用算法简介

转录组测序以及常用算法简介转录组测序,也被称为“全转录组鸟枪法测序”(WTSS),由于转录组测序的高覆盖率,它也被称为深度测序。它主要利用新一代高通量测序技术,对物种或组织的RNA反转录而成的cDNA文库进行测序,并得到相关的RNA信息。其研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA和非编码RNA。它是指用新一代高通量测序技术,对物种或组织的RNA反转录而成的cDNA文库进行测序,并得到相关的RNA信息。转录组测序根据有无基因组参考序列分为:有参考基因组的转录组测序,和无参考基因组的de novo测序。如果有基因组参考序列,可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息,而这些遗传信息可以广泛应用于生物学研究、医学研究、临床研究中。虽然转录组测序和基因组测序的步骤大体相同,但是在文库制备和分析方法上却有很大的区别。在生物信息学领域,序列比对作为识别DNA、RNA和蛋白质相似区域的有效手段,有助于我们更好地研究其结构、功能以及进化方向的关系。下图简要说明了转录组测序的主要流程:首先将细胞中所有的反转录产物转化为cDNA文库,再将cDNA随机剪切为小DNA片段,并在两端加上接头(Adapter),所得序列通过比对(有参考基因组)或者从头组装de novo(无参考基因组),形成全基因组范围的转录谱。?图1 转录组测序流程图常用算法简介TopHat(/software/tophat/index.shtml)TopHat是Cole Trapnell等人于2009年发表在Bioinformatics上的基于Bowtie的转录组测序比对算法,是马里兰大学生物信息和计算机生物中心,以及加利福尼亚大学伯克利分校数学系和分子细胞生物学系以及哈佛大学的干细胞与再生生物学系联合开发的结果。它通过超快的高通量短序列比对RNA序列来识别剪切位点。?图2 TopHat流程图TopHat首先先用Bowtie将RNA序列与整个参考基因组进行比对,找到匹配的序列,再用Maq合并匹配的序列,对外显子进行选择性的拼接。Bowtie在进行比对时可以兼容一定量的错误(默认值=2)。TopHat使用每个碱基2比特的编码方法对庞大的基因数据进行了有效地储存和管理,因此允许Bowtie在哺乳动物基因组序列比对时,只使用2GB左右的内存。TopHat可以发现大部分新的剪接位点,但如果外显子相距比较长,或者内含子为非经典内含子,TopHat则无法有效地发现。RUM(/RUM)RUM(RNA-Seq Unified Mapper)是Gregory R.Grant等人于2011年发表在Bioinformatics上的转录组测序比对算法。运算分为三个阶段,首先先用Bowtie把所有序列(reads)分别与参考基因组和转录组进行比对,合并结果后,把无法匹配的序列再用Blat(Blast Like Alignment Tool)与参考基因组进行比对,合并后得到最终结果。RUM很好地利用了Burrows-Wheeler压缩算法的高效快速,以及Blat的敏感性。Blat之前被认为不适合用作短序列的比对,而且由于速度太慢,也不适合进行大规模运算。但是Blat可以高效地进行短序列比对,识别新的剪切点。随着科技的发展,计算资源成本逐渐降低,比对序列的长度增加,使得Blat可以被更好地应用。?图3 RUM流程图MapSplice(/p/bioinfo/MapSpliceManual)MapSplice是Kai Wang等人于2010年发表Nucleic Acids Research上的具有高度特异性和敏感性的转录组测序比对算法。由于大多数内含子剪切位点具有GT-AG模式,即经典剪切位点,为保证准确性并节省时间,TopHat只报告含有经典剪切位点的内含子。MapSplice并不依赖剪切位点的特性或内含子的长度,它可以更好地检测到新的经典剪切位点和非经典剪切位点。MapSplice在比对的质量与序列的多样性之间做了一个很好的权衡。算法分为两个步骤:标记比对(tag alignment)和拼接推理(splice inference)。在第一阶段,被标记的mRNA与参考基因组G进行比对,产生可能的组合。之后,出现一个或者更多标记比对的剪接位点被筛选出来进行分析,根据比对的质量和多样性打分。STAR(/p/rna-star/)STAR(Spliced Transcripts Alignment to a Reference)是Alexander Dobin等人于2013年发表在bioinformatics上的一个快速普适的转录组测序比对算法。STAR可以准确比对由三代测序技术产生的长序列。与大部分比对软件不同,STAR不是单纯的由DNA短序列比对软件扩展

文档评论(0)

xufugen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档