第二代测序数据分析原理.pptVIP

下载本文档

1
0
约5.63千字
约 66页
2023-12-06 发布于广东
举报

第二代测序数据分析原理.ppt

分析所需工具BowtiesoftwareSAMtoolsTopHatsoftareCufflinkssoftwareCummeRbundsoftware本文档共66页；当前第28页；编辑于星期六\10点33分外显子组分析工具本文档共66页；当前第29页；编辑于星期六\10点33分主要的测序平台基因组分析原理转录组分析原理分析策略的选择本文档共66页；当前第30页；编辑于星期六\10点33分常规分析TranscriptsquantificationSplicingsitesdiscoveryandquantificationGenediscoverySNP/INDELdetectionAllelespecificexpression本文档共66页；当前第31页；编辑于星期六\10点33分本文档共66页；当前第32页；编辑于星期六\10点33分本文档共66页；当前第33页；编辑于星期六\10点33分本文档共66页；当前第34页；编辑于星期六\10点33分UniGene拼接目的：将预处理后reads进行拼接，得到拼接结果。

原理：应用deBruijngraphpath算法对reads进行denovo拼接；对上一步的拼接结果，再用HamiltonPath算法拼接。

结果：UniGene序列，UniGene统计信息，序列长度分布图本文档共66页；当前第35页；编辑于星期六\10点33分本文档共66页；当前第36页；编辑于星期六\10点33分3.数据库注释目的：对拼接得到的UniGene进行功能注释

原理：通过blast+算法将拼接得到的UniGene序列与数据库进行比对

结果：比对结果表格，物种分布统计和Evalue分布统计

本文档共66页；当前第37页；编辑于星期六\10点33分本文档共66页；当前第38页；编辑于星期六\10点33分UniGene表达分析目的：UniGene定量分析。

原理：以UniGene为reference，分别将每个样本的reads进行referencemapping,从而得到每个样本在每个UniGenes中的一个reads覆盖度，然后应用RPKM/FPKM标准化公式对富集片段的数量进行归一化。

RPKM：ReadsPerKilobaseofexonmodelperMillionmappedreads，公式下:本文档共66页；当前第39页；编辑于星期六\10点33分UniGene表达分布图，1X，5X分别为FPKM=1，FPKM=5分界点，可以大体观察到低表达，中表达以及高表达的比例关系本文档共66页；当前第40页；编辑于星期六\10点33分UniGene样本间表达相关性散点图本文档共66页；当前第41页；编辑于星期六\10点33分样本间表达差异程度的MA图，可以体现差异表达总体偏差本文档共66页；当前第42页；编辑于星期六\10点33分UniGene表达差异分析目的：对定量结果进行统计检验分析，找出差异表达UniGene

原理：双层过滤筛选差异基因

FC值筛选：采用Fold-change(FC)，表达差异倍数进行第一层此的差异基因筛选

FDR检验：一般采用卡方检验中的fisher精确检验进行p值检验，采用BenjaminiFDR(Falsediscoveryratio)校验方法对p值进行假阳性检验，即，通过FDR显著性参数进行第二层次的差异基因筛选。

本文档共66页；当前第43页；编辑于星期六\10点33分组间差异基因上调与下调个数统计，可以通过此图观察上调与下调的一个总体趋势本文档共66页；当前第44页；编辑于星期六\10点33分差异基因火山图，可以观察到差异基因总体分布本文档共66页；当前第45页；编辑于星期六\10点33分GO功能分类

目的：利用数据库注释信息将UniGene进行GO功能分类。

原理：利用数据库的注释结果，应用blast2GO算法进行GO功能分类，得到所有序列在GeneOntology的三大类：molecularfunction,cellularcomponent,biologicalprocess的各个层次所占数目，一般取到14层。

结果：MF，BP，CC三大分类结果文件以及UniGene2GO关系列表，三大类别中第二层次上的柱状分布图和饼图，GO功能的层次分布图。

本文档共66页；当前第46页；编辑于星期六\10点33分本文档共66页；当前第47页；编辑于星期六\1

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第二代测序数据分析原理.pptVIP