人-全基因组重测序结果报告.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人-全基因组重测序结果报告

人-全基因组重测序 结果报告 2017-03-10 - 1 - 目录 一、分析结果 - 4 - 1 测序评估 - 4 - 1.1 碱基含量分布检查 - 4 - 1.2 测序质量分布检查 - 4 - 1.3 测序数据质量情况汇总 - 5 - 2 比对统计 - 6 - 2.1 比对结果及比对 - 6 - 2.2 测序深度分布比对结果及统计 - 6 - 3 SNP 检测和注释 - 7 - 3.1 SNP 检测 - 7 - 3.2 SNP 注释及统计 - 7 - 3.3 大效应SNP 注释及统计 - 8 - 4 InDel 检测和注释 - 9 - 4.1 InDel 检测 - 9 - 4.2 InDel 注释及统计 - 9 - 5 SV 检测和注释 - 10 - 5.1 SV 检测 - 10 - 5.2 SV 注释及统计 - 11 - 6 CNV 检测和注释 - 11 - 6.1 CNV 检测 - 11 - 6.2 CNV 注释及统计 - 11 - 6.3 CNV 注释及统计 - 11 - 二、分析方法 - 13 - 1 重测序实验流程 - 13 - 2 生物信息分析流程 - 13 - 3 数据过滤参数设置 - 13 - 4 比对 - 14 - 5 SNP 和InDel 检测 - 14 - 6 SV 检测 - 15 - - 2 - 7 CNV 检测 - 15 - 8 Web Resources - 15 - 三、结果表格 - 16 - 四、参考文献 - 19 - - 3 - 一、分析结果 1 测序评估 根据项目合同要求,我们构建DNA 文库进行全基因组重测序。 1.1 碱基含量分布检查 单碱基组分分布图分布检查用于检测有无AT 、GC 分离现象。由于在基因组双螺旋DNA 中根据碱基 互补原则A 与T 配对、G 与C 配对,所以正常情况下A 与T、G 与C 碱基含量相等。在高通量测序过程 中,测序的对象是随机打断的DNA 片段,位点在基因组上近似均匀,所以测序结果中A 与T、G 与C 碱 基含量应该也近似相等。但是建库和测序的随机性问题,可能导致出现AT 、GC 分离现象。如果测序中该 碱基无法分辨是A 、T、G、C 这四种碱基的哪一种碱基,则标记为N ,测序reads 中N 含量也能反映测序 质量的好坏。 测序reads 前几个碱基AT 、GC 不等波动较大,高于其他测序区段是因为测序本身的关系属于正常情 况。其它区段的GC、AT 的含量相等,且分布均匀无分离现象,测序reads 中N 含量接近于0,说明测序 结果正常。样本碱基组分分布见下图: 图1 单碱基组分分布图 注:横坐标为reads 中的碱基位置,纵坐标为单碱基在该位点所占的比例;不同颜色代表不同的碱基类型;由于是双端 PE 测序,前 150 bp 为一个PE 对的第一端序列read1 ,后 150 bp 为另一端read2 。正常情况下样本无AT 和CT 分离,前几 bp 出现抖动情况是由于随机引物、测序反应开始酶和底物结合不太稳定导致,属于测序本身所带来的正常抖动。 1.2 测序质量分布检查 Illumina 的HiSeq2500/4000/XTen 平台的碱基质量值是用Qphred 表示,HiSeq2500 碱基识别(Bsae Calling) 分析软件为 OLB-1.9.4 ,HiSeq2500 V4 试剂碱基识别(Base

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档