- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
mummer使用
一、MUMmer3.22简介:
DNA和核苷酸的快速比对软件包。基于suffix tree 数据结构,快速、图形化、模块可用于其他软件、可进行大基因组比对、多对多基因组比对。
二、MUMmer3.22中五个常用的包:mummer、nucmer、promer、run-mummer1、run-mummer3
1、mummer
Mumme有效定位两序列的maximal unique matches,适用于产生准确匹配的列表,可以用点图表示出来,或者用作双向比对的anchors。
mummer [options] reference file query file1 . . . [query file32]
一个reference文件和至少一个query文件,Fast-A格式。大小写都可以,这样DNA和蛋白质序列都可以比对。query最多32个文件,但每个文件中包含的序列数没有限制。
2、NUCmer
NUCmer适用于亲缘关系较近的多核苷酸序列比对。首先找出给定长度的最大准确匹配,然后将这些匹配结果聚簇形成大的不精确的比对区,最后从每个匹配向外延伸将聚簇连接成单一的高打分pair-wise alignment。NUCmer适用于定位高度保守的DNA序列区。通过增加NUCmer的精确度,找到感兴趣的序列,独一无二的序列(减少重复序列)。
nucmer [options] reference file query file
FastA格式,不区分大小写,只有ACTG(不区分大小写)DNA字母可以比对。标准输出out.delta文件(ASCII文件)show-aligns和show-coords软件查看.delta文件内容。show-aligns展示序列,show-coords展示对坐标的概括、相似度百分比等等。
3、PROmer
PROmer用于核苷酸序列差别较大的比对,原理和NUCmer相似,只不过在准确匹配前先将输入的序列翻译成六种氨基酸阅读框架。使PROmer能识别在蛋白质序列水平上保守而在DNA水平不保守的区域,给出比NUCmer高的相似度。PROmer增加了敏感度导致高度相似序列的大量输出,所以,建议在输入的序列差异较大时使用。As with NUCmer, it is recommended to mask the input sequences to avoid the alignment of uninteresting sequence, or to change the uniqueness constraints (see the PROmer section) to reduce the number of repeat induced alignments.?
promer [options] reference file query file
FastA格式文件不区分大小写,只有有效的DNA字母可以翻译序列,标准输出out.delta文件(ASCII文件)show-aligns和show-coords软件查看.delta文件内容。
4、run-mummer1 and run-mummer3
三个步骤和NUCmer和PROmer一样,匹配、聚簇、延伸,但是他们可以处理任何输入的序列,不只是核苷酸。run-mummer擅长比对相似性较高的DNA序列,识别他们的区别,适合于SNP和错误检测。run-mummer1用于没有重排的1:1的比对,run-mummer适合于有重排的1:多的比对。
run-mummer1 reference file query file prefix [-r]
run-mummer3 reference file query file prefix
FstaA格式不区分大小写,reference文件只可以有一个单个序列,run-mummer只准许有一个query序列,run-mummer3对query序列个数没有限制。run-mummer1中-r参数用于反向匹配query序列,而run-mummer3自动正反匹配。输出文件:prefix.out, prefix.gaps, prefix.errorsgaps 和prefix.align。
三、使用案例
主程序》坐标》序列》数据过滤》可视化
1、Aligning two finished sequences
两个连续的序列
mummer -mum -b -c ref.fasta qry.fasta ref_qry.mums
mummerplot --postscript --prefix=ref_qry ref_qry.mums 全局比对可视化
gnuplot ref_qry.gp
Highly similar seq
文档评论(0)