Local BLAST简明教程.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Local BLAST简明教程

Local BLAST简明教程简介Local Blast 是Blast的本地化版本,与在线Blast原理相同,主要进行序列间相似性的检索优点:与在线Blast相比,其优点在于速度快,不受网络连接影响,且可进行批处理,数据易于处理。软件准备Blast+ 下载地址:/blast/executables/blast+/LATEST/blast/executables/blast+/LATEST基于不同操作系统选择不同的安装包,解压安装,通常默认安装到C:\Program files,此处可以把C:\Program files\NCBI的子文件夹(通常是blast + 2.2.23)重命名为blast,方便之后在dos中索引文件夹(可选)Perl for Windows主要用于下载NCBI上已有的构建好的数据库,但主要是人类、小鼠等,对于我们来说不常用下载地址:/releases.html/releases.html下载后直接安装即可构建数据库 方法一:1.直接下载fasta格式的序列文件序列文件的格式必须为fasta,文件来源不限,如NCBI、JGI等均可,但由于不同数据库中蛋白的ID不同,应结合后期数据分析具体要求进行选择2.在DOS系统中利用makeblastdb.exe构建数据库命令行:$ makeblastdb.exe –in protein.fasta –out protein_db –hash_index–dbtype prot输出的数据库的名称,不需要后缀要格式化的序列的名称,需要后缀输出的数据库的类型核酸:nucl蛋白:prot构建数据库 如:下载Aspergillus ruber基因组蛋白氨基酸序列,构建数据库首先在NCBI上检索该物种基因组构建数据库 基因组内共有10066个蛋白构建数据库 检索该基因组的蛋白,点击中间列右上角 “Send to”按钮,选择files,选择FASTA格式,创建文件即可构建数据库 将下载的序列重命名(默认下载文件名为sequence.fasta,容易混淆),保持后缀为fasta格式不变,置于blast\bin文件夹中,如果配置了环境变量,可置于任意位置,关于配置环境变量,点击此处。检查下载的序列是否完整(NCBI连接不稳定,有时候会丢数据),方法如下:用word打开序列文件,在文件内进行查找(快捷键Crtl+F),查找“”,查找结果数量即为下载得到的蛋白序列数量。配置环境变量返回在我的电脑上右击-属性-高级系统设置配置环境变量返回在弹出的窗口中点击右下角的“环境变量”按钮配置环境变量在用户变量或系统变量中选择PATH,点击“编辑”,在变量值后面添加“;”(注意需要在英文状态输入分号),然后添加Blast安装路径下面bin文件夹的路径,如;C:\Program files\NCBI\Blast\bin返回构建数据库 “开始”-“运行”(快捷键Windows键+R)-输入“cmd”,“确认”-进入DOS系统1.打开数据库(即序列文件)所在文件夹;2. 输入命令对数据库进行格式化。打开数据库所在文件夹运行命令,对数据库进行格式化格式化成功构建数据库 方法二 从NCBI中的ftp库下载所需要的数据库,地址:/blast/db/blast/db也可安装Perl程序后,运用Blast自带的update_blastdb.pl进行下载进入DOS后,打开Blast下的bin文件夹输入以下指令可以查看帮助(可不做)输入一下指令查看NCBI中的库输入相应的数据库名称进行下载,此方法下载得到的数据库不需进行格式化,以载体库(vector)为例准备待比对序列直接从NCBI上下载FASTA格式的序列即可,与数据库存放于同一位置(通常为Blast的bin文件夹下)如果需要批处理(即将多个序列与数据库进行比对),可将其多个序列文件整合成一个fasta文件,此处使用word或写字板均可。序列比对打开数据库及序列所在的文件夹,运行相应的blast命令即可如蛋白序列比对$ blastp.exe –query proteins.fasta –db all_proteins_db –out blast_result.xls 可输入 blastp –help 查看默认输出参数,即参数代码对照如果需要对输出文件输出的参数进行自定义,则增加-outfmt参数如只需要蛋白ID,Query Cover 和Identity 可增加参数-outfmt “6 qacc sacc qcovs pident”待比对序列名称,需要后缀数据库名称,不需要后缀结果文件名称,不同后缀可输出不同格式的文件,xls为excel格式,txt、xml等均可序列比对输出格式及参数说明序列比对输出格式及参数说明序列比对输出格式及参数说明tips在lo

文档评论(0)

189****1013 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档