全基因组重测序大数据解析报告.pdfVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实用标准 全基因组重测序数据分析 1. 简介 (Introduction) 通过高通量测序识别发现 de novo 的 somatic 和 germ line 突变,结构变异 -SNV ,包括 重排突变( deletioin, duplication 以及 copy number variation )以及 SNP 的座位;针 对重排突变和 SNP 的功能性进行综合分析;我们将分析基因功能(包括 miRNA ),重组 率 (Recombination )情况, 杂合性缺失 (LOH )以及进化选择与 mutation 之间的关系; 以及这些关系将怎样使得在 disease (cancer )genome 中的 mutation 产生对应的易感机 制和功能。 我们将在基因组学以及比较基因组学, 群体遗传学综合层面上深入探索疾病基因 组和癌症基因组。 实验设计与样本 (1 )Case-Control 对照组设计 ; (2 )家庭成员组设计:父母 - 子女组( 4 人、 3 人组或多人); 文案大全 实用标准 初级数据分析 1 .数据量产出: 总碱基数量、 Total Mapping Reads 、Uniquely Mapping Reads 统计, 测序深度分析。 2 .一致性序列组装:与参考基因组序列( Reference genome sequence )的比对分析, 利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型, 并组装出该个体基因组的一 致序列。 3 .SNP 检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深 度、重复性等因素作进一步的过滤筛选,最终得到可信度高的 SNP 数据集。并根据参考基 因组信息对检测到的变异进行注释。 4 .InDel 检测及在基因组的分布 : 在进行 mapping 的过程中,进行容 gap 的比对并检测 可信的 short InDel 。在检测过程中, gap 的长度为 1~5 个碱基。对于每个 InDel 的检测, 至少需要 3 个 Paired-End 序列的支持。 5 .Structure Variation 检测及在基因组中的分布 : 能够检测到的结构变异类型主要有:插 入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测 全基因组水平的结构变异并对检测到的变异进行注释。 高级数据分析 1.测序短序列匹配( Read Mapping ) 文案大全 实用标准 (1 )屏蔽掉 Y 染色体上假体染色体区域( pseudo-autosomal region ), 将 Read 与参考 序列 NCBI36 进行匹配 (包括所有染色体, 未定位的 contig ,以及线粒体序列 mtDNA (将 用校正的剑桥参考序列做替代) )。采用标准序列匹配处理对原始序列文件进行基因组匹配, 将 Read 与参考基因组进行初始匹配;给出匹配的平均质量得分分布; (2 )碱基质量得分的校准。我们采用碱基质量校准算法对每个 Read 中每个碱基的质量进 行评分,并校准一些显著性误差,包括来自测序循环和双核苷酸结构导致的误差。 (3 )测序误差率估计。 pseudoautosomal contigs ,short repeat regions (包括 segmental duplication ,simple repeat sequence- 通过 tandem repeat 识别算法识别) 将被过滤; 2. SNP Calling

文档评论(0)

meow9x + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档