- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
群体遗传变异鉴定工具系统比较-烟草科技
2018 年 1 月 烟草科技 Jan. 2018
第51 卷第 1 期 Tobacco Science Technology Vol. 51 No. 1
群体遗传变异鉴定工具系统比较
李泽锋,卢 鹏,张剑锋,张 慧,许亚龙,金静静*
中国烟草总公司郑州烟草研究院,郑州高新技术产业开发区枫杨街2 号 450001
摘要:针对不同大小的数据集,为选出最适合的群体遗传变异鉴定工具,对常用的samtools 、gatk 、
freebayes 和sambamba 软件进行了比较。利用不同的变异鉴定工具对3 个不同大小基因组(拟南芥、水稻
和人)的重测序数据和烟草1 号连锁群进行了变异提取。单样本数据和多样本数据的比较结果都表明,
samtools 和sambamba 软件倾向于寻找比较全面的变异,而gatk 和freebayes 软件倾向于寻找准确率较高
的变异。在速度方面,sambamba 软件明显快于其他软件,gatk 软件在多样本数据分析方面具有一定的
速度优势。在内存消耗方面,gatk 软件明显大于其他软件。
关键词:下一代测序;重测序;群体遗传变异;系统比较
中图分类号:Q-31 文献标志码:A 文章编号:1002-0861 (2018 )01-0008-07
Systematiccomparisonofpopulationgeneticvariationcallingtools
LI Zefeng, LU Peng, ZHANG Jianfeng, ZHANG Hui, XU Yalong, JIN Jingjing*
Zhengzhou Tobacco Research Institute of CNTC, Zhengzhou 450001, China
Abstract: To select suitable population genetic variation calling tools for various datasets, different software
tools (samtools, gatk, freebayes and sambamba) were compared. The variations were extracted from
resequencing datasets, including three species (Arabidopsis, rice and human) with different genome sizes and
tobacco linkage group 1, by different tools. The comparison results of single-sample and multiple-sample data
showed that samtools and sambamba tended to produce as much as variations, whereas outputs from gatk and
freebayes tended to contain higher accuracy variations. Sambamba was much faster than the other tools, and
gatk had some advantages in speed for multiple-sample data analysis. Gatk consumed much more computing
memory than the other tools.
Keywords:Next generation sequencing; Resequencing; Population genetic variation; Systematic comparison
下一代/二代测序技术 (Next generation 状/疾病基因的定位、外显子测序以及通过RNA 测
sequencing, NGS )的出现和发展对生命科学的研 序对表达水平进行量化的研究中,二代测序技术
[1-3
文档评论(0)