构建BLAST本地数据库.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
构建BLAST本地数据库

构建BLAST本地数据库 田云龙 前言 • BLAST 是一种被广泛使用的数据库搜索程序,许 多生物信息中心都有专门运行BLAST 的服务器, 提供图形界面的核酸或蛋白质序列搜索服务。如: /blast http://www.ebi.ac.uk http://www.blast.genome.ad.jp • 除使用WEB界面的BLAST 功能外, 还可以在本地 计算机上运行。下面就对学习过的在LINUX环境 下的命令行模式进行BLAST搜索比对进行总结。 创建本地数据库的两种途径 • 使用自己的序列数据 • 到GenBank、EMBJ、DDBJ、ExPAsy等数 据库去下载 如何利用自己的序列数据 • 以Fasta格式把自己所拥有的全部有关核酸 或蛋白质序列数据编辑到一个文件中,然 后使用formatdb命令进行格式化。这样一个 本地数据库就创建好了。 利用网络数据库搜索下载需要的序列数据 • 从GenBank、ExPAsy等网络数据库搜索自 己所需要的序列数据,并进行加工编辑, 如删减非目标数据、把几次搜索结果合并 为一个文件等。最后,同样使用formatdb命 令进行格式化。 • 例如:利用ExPAsy搜索构建一个非核糖体 肽合成酶(NRPS)蛋白质序列的本地数据 库,其操作步骤如下 • A.使用nrps为关键词在ExPAsy数据库中搜索,得到如下结果 B.在搜索结果页面底部的File name框中填入一个文件名nrp,再在Format项选 择Fasta,然后点击Create file生成搜索结果文件。其页面如下图所示: C.生成的文件存储在ExPAsy的FTP服务器上,可以选择马上下载下 来,也可以在一周之内的任何时间登录这个服务器下载。 下图所示即为ExPAsy的FTP服务器上所存储的搜索结果。 D.使用formatdb 命令对nrp 这个本地蛋白质 序列数据库进行格式化。formatdb 命令的 语法格式为: formatdb - i dtatbase • 本例中, 可以如此应用formatdb 命令: formatdb - i nrp • 同样,如果需要构建一个非核糖体肽合成 酶的核酸序列数据库,可依如下步骤进行: A .使用nonribosomal peptide synthetase为关键词在 GenBank的核酸序列数据库中搜索,得到如下结果。 • B.点击Show下拉菜单,选择500,然后点击 Display下拉菜单,选择Fasta,最后点击Send to 下拉菜单,选择file ,出现数据文件下载对话框。 以文件名sequences.fasta把序列数据文件保存到 目的目录下。在这一步,可以在保存数据文件之 前,先对检索结果进行筛选,把不符合条件的序 列数据过滤掉。 • C.把下载的序列数据文件进行编辑,如删除不 符合条件的序列数据等。 • D.使用formatdb 命令对sequences.fasta 这个本 地核酸序列数据库进行格式化。

文档评论(0)

kanghao1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档