- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本地blast使用
本 地 Blast 2013-2-22 张玉娟 在 线Blast: 本 地 Blast: (一)Windows系统单机完成; (二)上传服务器完成; (三)分析结果; (一)Windows系统单机完成; 将需要的文件放入同一个文件夹 formatdb blastall 产生out文件 服务器使用流程: 1. 安装SSH 2. 登陆:内网 120.94.179.252 用户名:class 密码:123 传输文件 终端命令行 cd ls (二)上传服务器完成; 一、两步完成本地BLAST: (1) formatdb --格式化序列数据库 命令示例:formatdb -i *.fasta -p T (2)Blastall 命令示例:blastall -p blastp -i ** -d * -e 1e-4 -o ***.blast (1)formatdb简单介绍: formatdb处理的都是格式为 ASN.1和 FASTA,而且不论是核苷酸序列数据库,还是蛋白质序列数据库;不论是使用Blastall ,还是Blastpgp,Mega Blast应用程序,这一步都是不可少的。 (2)formatdb常用参数简析: -i 输入需要格式化的源数据库名称 -p 文件类型,是核苷酸序列数据库,还是蛋白质序列数据库 T – protein F - nucleotide [T/F] Optional default = T -a 输入数据库的格式是ASN.1(否则是FASTA) T - True, F - False. [T/F] Optional default = F (3)Blastall常用参数简析 -p Program Name [String] 所用程序名称[String],用 户可以根据需要从blastn,blastp,blastx,tblastn,tblastx中任选一程序。 -d Database [String] default = nr 所用序列数据库的名称 [String],默认为:nr -i Query File [File In] default = stdin 所用查询序列文件[File In], 默认为:stdin,本文例为 test.txt -e Expectation value (E) [Real] default = 10.0 期望值[Real] 默认为10.0 描述搜索某一特定数据 库时,随机出现的匹配序列数目。 -m alignment view options: 比对显 示选项,其具体的说明可以用以下的比对实例说明 0 = pairwise,显示具体匹配信息(缺省) 1 = query-anchored showing identities,查询-比上区域,显示一致性 2 = query-anchored no identities,查询-比上区域,不显示一致性 3 = flat query-anchored, show identities,查询-比上区域的屏文形式,显示一致性 4 = flat query-anchored, no identities,查询-比上区域的屏文形式,不显示一致性 5 = query-anchored no identities and blunt ends,查询-比上区域,不显示一致性,无突然的结束 6 = flat query-anchored, no identities and blunt ends,查询-比上区域的屏文形式,不显示一致性 7 = XML Blast output,XML格式的输出 8 = tabular,TAB格式的输出 9 =tabular with comment lines,带注释行的TAB格式的输出 10 =ASN, text,文本方式的ASN格式输出 11 =ASN, binary [Integer] default = 0,二进制方式的ASN格式输出 (4)主要的blast程序 程序名 查询序列 数据库 搜索方法 Blastn 核酸 核酸 核酸序列搜索逐一核酸数据库中的序列 Blastp 蛋白质 蛋白质 蛋白质序列搜索逐一蛋白质数据库中的序列 Blastx 核酸 蛋白质 核酸序列翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。 Tblastn 蛋白质 核酸 蛋白质序列和核酸数据库中的核酸序列翻译后的蛋白质序列逐一比对。 TBlastx 核酸 核酸 核酸序列翻译成蛋白质序列,再和核酸
文档评论(0)