BLSAT本地化完全教程.doc

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
BLSAT本地化完全教程 Setp1: Blast软件下载与安装 1.对于windows 2000/xp 用户,下载blast-2.2.18-ia32-win32.exe安装文件 HYPERLINK /blast/executables/LATEST/blast-2.2.18-ia32-win32.exe /blast/executables/LATEST/blast-2.2.18-ia32-win32.exe 2.创建一个新目录,例如C:\blast,将下载的文件blast-2.2.18-ia32-win32.exe复制到该目录,双击这个文件,自解压产生bin、data、doc三个目录,bin是程序目录,data是程序使用数据的目录,doc是文档目录。 表:bin目录中的程序 程序 说明 bl2seq.exe 进行两条序列比对 blastall.exe 做普通的blast比对 blastclust.exe ? blastpgp.exe ? copymat.exe ? fastacmd.exe 通过gi号,接收号等,在数据库中检索序列 formatdb.exe 格式化数据库 formatrpsdb.exe ? impala.exe ? makemat.exe ? megablast.exe megablast程序 rpsblast.exe ? seedtop.exe ? 3.用文本编辑器创建一个ncbi.ini文件,文件包含下面内容: [NCBI] Data=C:\blast\data\ 将ncbi.ini文件存放到系统的Windows 或者 WINNT目录。 4.将”C:\blast\bin”目录添加路径中(该步骤非必须,但会给以后的操作带来方便),方法: 1)右击我的电脑选择属性,选择高级,点击环境变量, 设置环境变量 2)系统变量中,选择Path,点击“编辑”,在变量值的后面添加“; C:\blast\bin”,点击确定 将安装路径添加到path 5.测试,打开dos窗口(点击开始,选择运行,打开的输入框中输入“cmd”,确定),键入“blastall”,回车,如果安装正确,将显示 blastall的所有参数说明。 安装测试 注意: 如果报错:“‘blastall’不是内部或外部命令,也不是可运行的程序或批处理文件。”,请检查环境变量设置,或者切换到安装目录的bin目录下,再执行。 如果报错:“FATAL ERROR: FindPath failed.”,请检查ncbi.ini文件。 HYPERLINK /bio/?p=1473 \o Permanent Link to Blast本地化:构建自己的搜索数据库 Step2: 构建自己的搜索数据库 blast数据库指包含fasta格式的核苷酸或者蛋白质序列的文件,有三种方式得到fasta格式的序列。 1 从NCBI的FTP下载相关的数据库文件 FTP地址: HYPERLINK /blast/db/ /blast/db/,如果你仅是一个测试,请下载一个较小的文件作为例子,例如下载大肠杆菌的核酸序列库——ecoli.nt.Z (1349 Kb)。FTP上的数据库文件都经过了压缩,有关每个文件的含义,请看该目录下说明文件( HYPERLINK /blast/db/blastdb.html /blast/db/blastdb.html ),下表FASTA目录下文件的说明: 文件名 大小(kb) 内容 alu.a.gz 90 alu重复序列的转录的蛋白质 alu.n.gz 24 alu重复序列 drosoph.aa.gz 4183 果蝇的蛋白质序列? drosoph.nt.gz 36059 果蝇基因组组序列 env_nr.gz 806964 环境蛋白质序列 env_nt.gz 2298189 环境核酸序列 est_human.gz 1395676 人的EST序列 est_mouse.gz 774668 老鼠的EST序列 est_others.gz 7360044 除人和老鼠以外的其他物种的EST序列 gss.gz 4772615 来源于GenBank, EMBL, and DDBJ的GSS序列 htg.gz 6148203 来源于GenBank, EMBL, and DDBJ的高通量基因组测序序列 human_genomic.gz 2509222 人类基因组序列(NC_######) igSeqNt.gz 18900 人和老鼠的免疫球蛋白可变区的核酸序列 igSeqProt.gz 3072 人和老鼠的免疫球蛋白可变区的蛋白质序列 mito.aa.gz 316 线粒体蛋白质序列 mito.nt.gz 935 线粒体基因组 month.aa.gz 50009 每月更新的蛋白质序

您可能关注的文档

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档