blast本地化详细流程.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Blast 2.4.0+本地化详细流程(基于Windows系统) 程序获得。从NCBI上下载Blast本地化程序,下载地址: /blast/executables/blast+/LATEST/ 64×安装版▲ 64×解压(绿色)版▲ 最好安装或解压到X盘根目录:如X:\blast,尽量简短,方便后边命令输入。 原始序列获得。方法1:找到转录组测序数据unigene数据库文件:unigene.fasta或unigene.fa,若为unigene.fa则直接改后缀为.fasta即可。找到或修改后将数据库文件移动至Blast本地化程序目录“X:\blast\bin”。方法2:从NCBI中的 ftp 库下载所需要库,链 /blast/db/FASTA/,其中nr.gz为非冗余的数据库,nt.gz为核酸数据库,month.nt.gz为最近一个月的核酸序列数据。下载的month.nt.gz先用WINRAR解压缩,然后用makeblastdb.exe格式化。方法3:利用新版blast自带的update_blastdb.pl进行下载,这需要安装perl程序。 注释:上述三种方法各有优缺点,前两种下载速度较快,但是每次进行检索都需要对数据库进行格式化(转化成二进制数据),第三种方法下载速度较慢,但是NCBI 中已经格式化好的,在进行本地检索时不需再进行格式化,直接用即可。 用文本编辑器(txt文件改名字及后缀)创建一个ncbi.ini文件,文件包含下面内容:[NCBI]Data=C:\blast\data\ 先新建TXT文件,然后改属性,将ncbi.ini文件存放到C:\Windows 将Blast本地化程序目录添加路径中(该步骤非必须,但会给以后的操作带来方便),方法: 右击我的电脑选择属性,选择高级,点击环境变量,设置环境变量 系统变量中,选择Path,点击“编辑”,在变量值的后面添加Blast本地化程序所在路径,E:\blast 点击确定,将安装路径添加到path。 运行MS-DOC。打开DOC窗口(点击开始,选择运行,打开的输入框中输入“CMD”,确定),访问Blast本地化程序所在文件夹,依次输入:(1)X: 回车;(2)cd blast\bin,回车。 数据初始化。下载得到的数据库为fasta格式,需要经过格式转化才能建立本地数据库。上接第5(2)步,回车后,输入格式化数据库命令:(右键可粘贴)makeblastdb.exe –in xxx.fasta -parse_seqids -hash_index -dbtype prot,回车,在原数据库文件所在文件夹生成一系列文件,Blast本地化体系构建完成。 blast本地化命令▲ blast本地化后生成的文件▲ 参数注释:-in参数后面接将要格式化的数据库;-parse_seqids,-hash_index两个参数一般都带上,主要是为blastdbcmd取子序列时使用,-dbtype后接所格式化的序列的类型,核酸用 nucl,蛋白质用prot。 待比对文件建立。在blast\bin文件夹创建test.txt文件,将需要blast的序列以fasta格式存于该文件中,文件名自己命名即可,这里以test为例。建立fasta文件注意事项请查看附件1。若有NCBI上下载好的.fasta文件,直接放到blast\bin文件夹即可。 test.fasta格式文件制作▲ 本地Blast比对。上接第6步,在MS-DOS窗口输入比对命令:blastn.exe -task blastn -query test.fasta -db xxx.fasta -out text.txt,稍等片刻,Blast结果即存于系统自动生成的out.txt文件中。blastn.exe -task blastn -query RefGene.txt -db Stellera.Unigene.fasta -out RefGene(test).txt -evalue 1e-5 -num_threads 8 参数注释:blastn.exe为程序执行命令,程序根据自己需要而blastn,blatp,tblastx;-task后面选择你所要用的程序blastn,blatp,tblastx等;-query?后接查询序列的文件名称;-db后接格式化好的数据库名称;-out?后接输出的文件名称及格式。 by malapidan 2016.08.24 附件1 FASTA格式说明 构建FASTA格式文件 所有TEST序列输入必须是FASTA格式,所谓FASTA是指DNA 序列第一行开始于一个标识符:,紧接着(没有空格)是对该序列的唯一描述(即ID),然后一个空格,接着是对该序列的描述(也可以没有),从第二行开始就是一行行的序列,中间的空格

文档评论(0)

汪汪队 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档