第二代测序数据分析原理.pptVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

分析所需工具Bowtiesoftware-/index.shtml/SAMtools-/TopHatsoftare-/Cufflinkssoftware-http://C/CummeRbundsoftware-/cummeRbund/第29页,共67页,星期日,2025年,2月5日外显子组分析工具PlatformAlignmentFindVariationsSolexaSOAP,bwaSOAPsnpsamtoolsSolidBioscope,BFASTBioscope,BFAST454BLAST,NEWBLERnewbler第30页,共67页,星期日,2025年,2月5日主要的测序平台基因组分析原理转录组分析原理分析策略的选择第31页,共67页,星期日,2025年,2月5日常规分析TranscriptsquantificationSplicingsitesdiscoveryandquantificationGenediscoverySNP/INDELdetectionAllelespecificexpression第32页,共67页,星期日,2025年,2月5日第33页,共67页,星期日,2025年,2月5日第34页,共67页,星期日,2025年,2月5日第35页,共67页,星期日,2025年,2月5日UniGene拼接目的:将预处理后reads进行拼接,得到拼接结果。

原理:应用deBruijngraphpath算法对reads进行denovo拼接;对上一步的拼接结果,再用HamiltonPath算法拼接。

结果:UniGene序列,UniGene统计信息,序列长度分布图第36页,共67页,星期日,2025年,2月5日第37页,共67页,星期日,2025年,2月5日3.数据库注释目的:对拼接得到的UniGene进行功能注释

原理:通过blast+算法将拼接得到的UniGene序列与数据库进行比对

结果:比对结果表格,物种分布统计和Evalue分布统计

第38页,共67页,星期日,2025年,2月5日第39页,共67页,星期日,2025年,2月5日UniGene表达分析目的:UniGene定量分析。

原理:以UniGene为reference,分别将每个样本的reads进行referencemapping,从而得到每个样本在每个UniGenes中的一个reads覆盖度,然后应用RPKM/FPKM标准化公式对富集片段的数量进行归一化。

RPKM:ReadsPerKilobaseofexonmodelperMillionmappedreads,公式下:第40页,共67页,星期日,2025年,2月5日UniGene表达分布图,1X,5X分别为FPKM=1,FPKM=5分界点,可以大体观察到低表达,中表达以及高表达的比例关系第41页,共67页,星期日,2025年,2月5日UniGene样本间表达相关性散点图第42页,共67页,星期日,2025年,2月5日样本间表达差异程度的MA图,可以体现差异表达总体偏差第43页,共67页,星期日,2025年,2月5日UniGene表达差异分析目的:对定量结果进行统计检验分析,找出差异表达UniGene

原理:双层过滤筛选差异基因

FC值筛选:采用Fold-change(FC),表达差异倍数进行第一层此的差异基因筛选

FDR检验:一般采用卡方检验中的fisher精确检验进行p值检验,采用BenjaminiFDR(Falsediscoveryratio)校验方法对p值进行假阳性检验,即,通过FDR显著性参数进行第二层次的差异基因筛选。

第44页,共67页,星期日,2025年,2月5日组间差异基因上调与下调个数统计,可以通过此图观察上调与下调的一个总体趋势第45页,共67页,星期日,2025年,2月5日差异基因火山图,可以观察到差异基因总体分布第46页,共67页,星期日,2025年,2月5日GO功能分类

目的:利用数据库注释信息将UniGene进行GO功能分类。

原理:利用数据库的注释结果,应用blast2GO算法进行GO功能分类,得到所有序列在GeneOntology的三大类:molecularfunction,cellularcomponent,biologicalprocess的各个层次所占数目,一般取到14层。

结果:MF,BP,CC三大分类结果文件以及UniGene2GO关系列表,三大类别中第二层次上的柱状分布图和饼图,GO功能的

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档