- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
#软件工具#使用Platanus进行组组装
1.platanus的安装
$mkdir/opt/biosoft/platanus
$wget
-P/opt/biosoft/platanus
$wget
E-P/opt/biosoft/platanus
$chmod755/opt/biosoft/platanus
的两个文件分别是主程序和说明文件。
2.platanus的使用
platanus下包含三个命令,分别是assemble,scaffold,
gap_close。其用法如下:个
这3个命令的共同参数为:
-t使用的线程数,此值=100,默认值为1。
-o输出文件的前缀,默认值为out。
2.1assemble
此命令基于Bruign图的算法来组装出contig
-fFILE1[File2...]
输入的文件,支持输入的文件总输入最大为100。文件可以为fasta
或fastq格式。软件会自动识别其格式。不会运用到碱基质量值,
碱基质量值对组装无任何影响。
-kINT
初始的k-mer大小,默认值为32。数据覆盖度低时,该值要设小
些。
-sINT
k-mer值的步进。此值必须=1,默认值为10。程序会使用多个
K-mer值进行contigs组装。
-nINT
初始的k-mer覆盖度的cutoff。默认值为0,即自动取值。自动取
值依赖于k-mer的频率分布。如果其分布不正常,则应该手动设
置。
-cINT
设置最小的k-mer覆盖度。默认值为2。在k-mer值越大的时候,
则k-mer覆盖度越小,其cutoff值越小,但此cutoff值不能低于此
参数设置的值。
-aFLOAT
K-mer值增大的安全性水平,默认值为10.0。增大最终的k-mer
值。如果牺牲准确性来延伸contig,则设置较低的值,比如为5.0。
-uFLOAT
消除气泡所运行的最大差异,默认值为0.1。此值越大,则越容易消
除气泡。特别是组杂合率高时,此值推荐设置更高,比如为
0.2。
-dFLOAT
当分支的覆盖率超过此值时,则截断分支,默认值为0.5。此值越
小,则准确率越高。如果碱基错误率较低,则适合设置较低的值,比
如0.3。
-mINT
限制内存,单位为GB,默认值为16。当程序需要消耗的内存超过
此值,则会提示警告,但不会中断运行。
此程序输出的文件为
PREFIX_contig.fa组装出的连续的序列
PREFIX_contigBubble.fa融合并删除的气泡序列
PREFIX_kmerFrq.tsvk-mers频数的分布
2.2scaffold
scaffold用于将pairedreads比对到contigs上,并确定contigs的
顺序和方向,构建出scaffolds。
-cFILE1[FILE2...]
contig文件。在此fasta文件的header中,程序识别字符‘cov’并
将其后的数值作为覆盖度的值。即使没有cov
文档评论(0)