鸡的标记选择筛选和基因分型性能案例研究.pdfVIP

鸡的标记选择筛选和基因分型性能案例研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
鸡的标记选择筛选和基因分型性能案例研究

ApplicationNote 在基因分型的de novo SNP选择过程中 如何减少测序错误、单态和表现差的标记物 鸡的标记选择、筛选和基因分型性能案例研究 摘要 近年来全基因组DNA测序的发展彻底改变了我们发现基因组变异的能力,从而实现了高统计意义的基因分型研究。本应用指南介绍 了筛选大SNP集合的过程,以便灵巧地选择出最具信息量的变异,用于下游的高通量基因分型实验,这些SNP是在测序研究中鉴定出 的。此过程已被成功应用在畜牧、水产动物和植物的基因分型标记组合的开发,包括二倍体和多倍体物种。在此,我们介绍了一个案 例研究,应用于鸡的标记物验证和选择。 简介 大型的SNP发现项目证实,大量样本的低覆盖度NGS是一种比少量样本的深度NGS更有统计学意义的de novo变异发现模式1。然而, 虽然有着强大的发现能力,NGS技术也被认为带来高比例的序列错误和丢失数据2 ,这在低覆盖度测序时被放大。 据报道,不同供应商的NGS平台有着6.3%至7.8%的错误发现率3 ,这相当于在50,000个SNP的分析组合中有超过3,000个假阳性。在 真阳性SNP位点,基因型准确率随着覆盖度的下降而下降。我们利用Axiom®基因分型方案对来自低和高覆盖度的NGS数据的数百万 个SNP基因型开展了广泛验证,Axiom®方案本身与金标准参考数据集有着99.8%的一致性。 我们的验证分析(表1)表明,30倍NGS数据对所有基因型种类有着高于98%的一致性。其他人此后表示,以可接受的低错误率检出基因 组中的基因型,需要40倍的NGS覆盖度4 。我们的分析还表明,4倍NGS SNP发现数据通过错误检出杂合子而高估了主要纯合子频率。 这种偏向导致,主要纯合子一致性与芯片参考数据相比看似不错,但代价是9.9%的杂合子错误率和11.6%的次要纯合子错误率。 因此,低覆盖度NGS数据中的序列和基因型错误会成为错误和冗余SNP的主要来源。当然,由于与选择的基因分型分析不兼容、附近 的二次多态性或其他技术因素,更多的标记物会聚类不佳。 Concordance compared to Axiom® genotypes 4x data 30x data 主要纯合子 99.7% 99.9% 杂合子 90.1% 99.8% 次要纯合子 88.4% 98.5% 表1 :与Axiom®基因分型芯片上产生的参考基因型数据集相比,低和高覆盖度新一代测序 数据的基因型一致性。 假阳性和冗余标记对研究统计学意义和成本的影响 对于一个在芯片或其他技术上开发基因分型标记组合的实验室来说,这些标记丢失来源的影响很明显。首先,包含因测序错误引起的 假阳性SNP或表现不佳的标记物浪费时间和金钱,并削弱标记物组合分析的能力以及使用它的研究。其次,在真正的SNP位点,NGS 基因型的错误会导致不正确的等位基因频率估计、不正确的连锁不平衡(LD)图谱构建,最终导致标记物选择不理想。 5 最近发表的一篇文章介绍了大豆基因分型芯片的设计和验证,表明如果de novo标记在选择之前未经过验证,标记组合的性能可能与 原先的芯片设计有相当大的差异。从60,800个SNP的目标组合开始,作者报道了4,704个(8%)标记因假阳性、群体研究中的单态性或聚 类性能差而丢失。当他们还包含因微球阵列制造过程中引起的随机丢失时,便总共失去了13,465个(22%)芯片内容。 计划de novo标记验证策略的研究人员可能会降低测序错误、不准确的等位基因和LD预测、标记选择不佳,因假阳性、群体特异的单 态、下游基因分型实验中标记表现不佳而引起的丢失。通过验证策略,研究人员可提高覆盖度,增强统计学意义,并减少标记冗余。 可靠标记物选择策略的要求 可靠的标记组合开发需要在选择之前进行de novo变异的验证。这将带来一组经过优化的标记,它们具有研究透彻的覆盖度、性能和群 体相关性。 使用另一种技术进行数据验证的概念在科学中并不少见。例如,文献中有数百篇文章用实时定量PCR来验证芯片所发现的基因表达差

文档评论(0)

sunshaoying + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档