BLAST序列相似性检索.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
BLAST序列相似性检索.doc

BLAST序列相似性检索 序列类似性检索就是将新测定的核酸或蛋白质序列对核酸或蛋白质序列数据库进行检索,找出与之相似的序列,从而评判新测定的序列是重复别人的工作,还是在前人的基础上有所创新,或是发现了新的序列。现在用于序列类似性检索的软件很多,下面主要介绍GenBank的序列类似性检索工具棗BLAST。 1. BLAST简介 BLAST是Basic Local Alignment Search Tool的英文缩写,意即碱基局部对准检索工具,是一种序列类似性检索工具。它采用统计学记分系统,能将真正配对的序列同随机产生的干扰序列区别开来;同时采用启发式算法系统,即采用的是局部对准算法(Local Alignment Algorithm),而不是全序列对准算法(Global Alignment Algorithm)。全序列对准算法是在检索结果中两个被比较序列所有片断均类似;而局部对准算法是找出两个被比较序列的“最类似”片断,并得出可能只包含两个序列的某个部分的对准结果。 在BLAST的基础上,NCBI又开发了BLAST 2.0、Gapped BLAST和PSI-BLAST。BLAST 2.0是一种新的BLAST检索工具,它对BLAST作了改进,运行速度更快,灵敏度更高,同时具有Gapped BLAST和PSI-BLAST两种软件的新功能。Gapped BLAST允许在对准的序列中引入空位(碱基缺失或插入),引入“空位”(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific Iterated BLAST,意即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源(Sequence Homologues)的有效方法。目前,PSI-BLAST仅用于比较蛋白质查询序列与蛋白质数据库中的序列的类似程度。 2. 使用NCBI BLAST服务的四种基本方法 (1)经由WWW使用的BLAST 使用BLAST最容易的方法是WWW方式。在用户的浏览器中键入NCBI的URL地址:http//,进入NBCI主页,然后链接到BLAST主页。BLAST主页提供了好几种BLAST检索软件,包括BLAST、BLAST 2.0、Gapped BLAST和PSI-BLAST等,其中BLAST和BLAST 2.0提供了基本检索和高级检索两种模式。 (2)网络版的BLAST BLAST2是标准的网络BLAST客户软件,它可以通过NCBI匿名的FTP服务器()下的/blast/network/blast2/获取。 PowerBlast是用于大规模分析基因序列的网络BLAST客户应用软件,它可以通过NCBI匿名的FPT服务器()下的/blast/network/blast2/powerBLAST/获取。 (3)独立运行的BLAST BLAST 2.0可以在本地计算机上独立运行,也可以在自建的序列数据库中进行BLAST检索,还可以下载NCBI数据库中的记录。BLAST运行的软硬件环境为IRIX 6.2、Solaris 2.5、PEC OSF1(第四版)和Win32系统。可独立运行的BLAST 2.0在NCBI匿名的FTP服务器()下的/blast/executables/获取。 (4) 电子邮件的BLAST 通过电子邮件对基因库进行BLAST检索(详见本章第四节二)。 3. BLAST的检索方法 (1) BLAST数据库的选择 BLAST检索的数据库包括两大类:一类是肽序列数据库,另一类是核酸序列数据库。 肽序列数据库包括: nr: 所有无冗余基因库CDS转录产物、PDB、SwissProt以及PIR序列 month: 最近30天注释的所有新增的或修订的基因库CDS转录产物、PDB、SwissProt和PIR序列。 SwissProt: SwissProt蛋白质序列数据库中最新的主要注释(无更新)序列。 yeast: Yeast(Saccharomyces Cerevisiae)蛋白质序列。 E.coli: E.coli基因CDS转录产物。 pdb: 从Brookhaven蛋白质序列数据和三维结构衍生出来的序列。 Kabat [Kabatpro]: 免疫学上感兴趣的蛋白质序列Kabat数据库。 alu: 从重复序列数据库(REPBASE)选取的Alu重复序列,适用于过滤查询序列中Alu重复序列。通过匿名FTP从下的/pub/jmc/alu目录中获取。 核酸序列数据库包括: nr: 所有无冗余的GenBank+EMBL+DDBJ+PDB序列;但不包

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档