- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.
.
RepeatMasker网 页 版 使用说明(中文翻译版)
引用自Tarailo-Graovac M, Chen N. Using RepeatMasker to identify repetitive elements in genomic sequences. Curr Protoc Bioinformatics. 2009 Mar;Chapter 4:Unit 4.10. doi: 10.1002/0471250953.bi0410s25.
RepeatMasker是一款广泛应用于基因鉴定、分类和mask repetitive elements,包括低复杂度序列和散布重复序列。RepeatMasker通过将数据库如:Repbase中已知的重复序列与输入的基因组序列比对来搜素重复序列。在此我们描述两个基础协议,它对如何运用RepeatMasker去分析基因组序列的重复元件提供细节上的指导,而不论是通过网络界面还是通过Unix/Linux命令系统。在RepeatMasker中的序列比较通常经过cross-match程序的序列比对来实现,对于较大序列这一过程需要大量处理时间。交替协议描述的是通过应用诸如WU-BLAST这样的选择性比对程序来怎样减少处理时间。而且RepeatMasker的优势、局限和已被发现的漏洞将在此进行讨论,最后提供理解其处理结果的指南。
在新的RepeatMasker程序包中添加了鉴定蛋白质序列的重复原件的程序。
要运行RepeatMasker,首先要选择重复库文件(repeat library files),这一文件包含重复元件共有序列。目前,Repbase Update是最大的商业性(商购)重复库(free for academic use)并且包含了相当数量的包括人、啮齿动物、斑马鱼、果蝇以及拟南芥在内的生物体。生物体的库文件中没有Repbase Update时,库文件会用RECON (Bao and Eddy, 2002; /recon.html)或RepeatScout (/repeatscout/; Price et al., 2005)从头产生。最新版本的RECON v.1.06已经发布并且可以从 /RepeatModeler.html.中获得RepeatModeler程序包。RepeatMasker的序列比较常通过Phil Green改进的cross-match (/consed/consed.html#howToGet)来实现,另外也可以为了快速程序来用WU-BLAST (/help/wublast.html; see Alternate Protocol)来代替cross-match。
通过网络界面运用RepeatMasker
RepeatMasker可通过 /cgibin/WEBRepeatMasker来获得,它不像命令行版本的RepeatMasker,网络版RepeatMasker的核苷酸序列长度限制在100kb,不能分析长度超过100kb的序列(提示会在窗口中显示)。短于100kb的序列可以用网络版RepeatMasker来分析,其花费的时间与序列的长度相关。对于北美以外的快速服务有在德国、以色列和澳大利亚的RepeatMasker镜像网站。另外,如果常规分析大片段序列,最好是下载并本地运行命令行版本。重要的是,如果需分析的序列超过100kb,唯一的选择就是下载RepeatMasker并在本地运行。
必需资源
硬件:任意一台联网的计算机。
软件:浏览器 如IE或火狐浏览器
文件:FASTA文件或能通过网络界面处理的收集的FASTA文件。
1. 点击网页浏览器,进入 /cgi-bin/WEBRepeatMasker.通过序列名或浏览文件下载FASTA序列文件(最大100kb),或者粘贴FASTA序列(最大100kb)到指定的文本框。
如果输入的序列包含非DNA符号或者序列太长,RepeatMasker会提示错误信息。
2. 从单选框下的“return format”来选择结果的格式:“html”或“tar file”。
如果选择“html”,那么结果会以一个超文本标记语言(html.)文件输出。如果选择“tar file”,那么结果会打包为用Unix系统“tar”协议的文档。
3. 从“return method”下两个单选按钮选择会送结果的方法,即:“html”或“email”。
如果选择这一步和上述第2步都选择“html”,那么所有的结果会通过窗口显示,如果过这步选择“html”,而第2步却选择“tar file”,那么结果会在窗口内提供链接。如果选择“email”,那么需要填写电子邮件地址,以确保结果可以通过电子邮件发送
文档评论(0)