转录组ref流程工作手册.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
转录组ref流程工作手册

转录组ref流程工作手册 一、Reference 流程生物学原理 1.1 实验流程 图一:转录组实验流程 当我们得到样品时,必须对其测序,才能得到分析所需的数据。测序基本过程:提取样品总RNA后,用带有Oligo(dT)的磁珠富集真核生物mRNA(若为原核生物,则用试剂盒去除rRNA后进入下一步)。加入fragmentation buffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H 和DNA polymerase I合成第二条cDNA链,在经过QiaQuick PCR试剂盒纯化并加EB缓冲液洗脱之后做末端修复并连接测序接头,然后用琼脂糖凝胶电泳进行片段大小选择,最后进行PCR扩增,使用建好的测序文库进行测序。 得到RNA的序列后,又可以找到它的参考序列(物种本身的基因、基因组)时,可以用reference流程对数据进行详细的分析。Reference后面所有的流程都是基于参考序列进行的,所以选择正确的参考序列十分重要。 1.2信息分析流程 得到测序序列后,即可利用比对软件,将所测序列比对到参考基因或基因组上,并进行后续分析,信息分析流程图如下: 图二:转录组信息流程 1.2.1原始fq序列简介 测序得到的原始图像数据经base calling转化为序列数据,我们称之为raw data或raw reads,结果以fastq文件格式存储,fastq文件为用户得到的最原始文件,里面存储reads的序列以及reads的测序质量。在fastq格式文件中每个read由四行描述: @TGGCGGAGGGATTTGAACCC + bbbbbbbbabbbbbbbbbbb 每个序列共有4行,第1行和第3行是序列名称,由测序仪产生;第2行是序列;第4行是序列的测序质量,每个对应第2行每个碱基,第四行每个对应的ASCII值减去64,即为该碱基的测序质量值,比如h 对应的ASCII值为104,那么其对应的碱基质量值是40。碱基质量值范围为0到40。1为Solexa测序错误率与测序质量值简明对应关系Qphred =-10 log10(e) 表 1 Solexa测序错误率与测序质量值简明对应关系 测序错误率测序质量值对应字符原始序列数据经过去除杂质后得到的数据Clean reads,后续分析都基于Clean reads使用短reads软件SOAP{Li, 2009 #155}将clean reads分别比对到参考基因组和参考基因序列(允许两个碱基错配)。 通过这一步骤,我们可以将测序得到的reads对应到基因及基因组上,后续分析都是基于上述比对结果。 1.2.4基本生物信息分析结果 基本信息分析结果包含以下内容: 1 测序数据产量及与 Reference 比对结果概述2 评价测序随机性3 基因覆盖度、测序深度的分布4 Reads 在参考基因组上的分布该分析主要是以图形方式概括给出Reads在基因组各个位置的分布情况,以及该位置基因的分布情况。1 对基因结构进行优化 ’端发生延长的情况)。 图三:基因结构优化 2 鉴定基因的可变剪切 {Black, 2003 #6}{Stamm, 2005 #21;Lareau, 2004 #22}。虽然已知可变剪切在真核生物中普遍存在,但我们可能仍低估了可变剪切的比例,最近,基于高通量测序的可变剪切研究在人{Pan, 2008 #3} {Wang, 2008 #4} {Sultan, 2008 #5}、小鼠{Tang, 2009 #18;Mortazavi, 2008 #19}、拟南芥{Filichkin, #156}中发现了很多新的可变剪切事件。 在生物体内,主要存在7种可变剪切类型:A)Exon skipping; B)Intron retention; C) Alternative 5’ splice site; D) Alternative 3’ splice site; E) Alternative first exon; F) Alternative last exon; G) Mutually exclusive exon. 下图是我们利用高通量测序数据鉴别出来的7种可变剪切。图中每个位置的ExP.Level等于log2(Reads数)。 图四:可变剪切示意图 A) Exon Skipping. 基因AK070385发生可变剪切形成两种不同的转录本,第1种转录本比第2种转录组本多一个外显子(exon), 我们将这种外显子称为inclusive exon, inclusive exon两侧的两个外显子称为 constitutive exon。B) Intron retentio

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档