1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
8序列比对,序列比对软件,blast序列比对,序列比对网站,多重序列比对,基因序列比对,序列比对算法,在线序列比对,blast,多序列比对

第五章 序列比对 例:找出phyA蛋白质的相似序列 第二节 相关算法 欧洲生物信息研究所BLAST服务器的用户界面(图4)比较简洁,提供的数据库和参数很多,用户可以根据不同要求,选择不同的数据库和各种参数。一般情况下,可以先按照系统给定的缺省参数进行初步搜索,对结果进行分析后再适当调整参数,如改变相似性矩阵、增加或减少空位罚分值、调节检测序列滑动窗口大小等。对于核酸序列数据库,一般选择重复序列屏蔽功能,而对于蛋白质序列,特别是球蛋白,通常不必选择重复序列屏蔽功能。 图4 欧洲生物信息学研究所的BLAST服务器的用户界面 图5是BLAST程序运行结果实例。这里,检测序列是与细胞凋亡有关的人自噬基因氨基酸序列,通过欧洲生物信息学研究所的BLAST服务器对包括SwissProt和TrEMBL数据库在内的蛋白质数据库进行搜索。输出结果中包括程序名称、版本号以及文献引用出处,以及检索序列的名称、数据库名称;列出相似性值较高的序列条目,以及它们在数据库中的编号和简要说明。每个条目后面给出相似性分数值Score和期望频率值E,以相似性分数值大小为序排列,分数越高,相似性越大。而E值则表示随机匹配的可能性,E值越大,随机匹配的可能性也越大。最后给出检测序列和目标序列的比对结果(限于篇幅,图中只给出检测序列和一个目标序列的比对结果)。 图5 BLAST程序运行结果实例 最初的BLAST程序只能用于无空位的比对。经验表明比对结果通常会出现一些无空位但不连续的区域,不难想象,有些高分值片段对可以通过一些相似性较低且有空位的片段连接起来,组成了一些更长的或许更具实际生物学意义的比对。 基于上述思路,BLAST算法经过改进允许空位插入(Altshul等,1997)。为缩短对数据库初始搜索的时间,新的算法只找出一个最好的高分值片段,并以此为基础运用动态规划方法将这一片段向两端延伸,最终产生的比对结果可能有空位插入。由于免去了查找所有高分值片段对的步骤,新的算法比原算法快3倍。对BLAST算法的进一步扩充,可以考虑双序列比对和多序列比对的有效结合 允许空位的 BLAST 位点特异性BLAST叠代搜索 位点特异性BLAST(Position-Specific Iterated BLAST,简称PSI-BLAST)叠代搜索(Altschul等,1997),是一种将双序列比对和多序列比对结合在一起的数据库搜索方法。 位置特异性叠代BLAST (Position-Specific Iterated BLAST,简称PSI-BLAST)则是对蛋白质序列数据库进行搜索的改进,其主要思想是通过多次叠代找出最佳结果。 具体做法是利用第一次搜索结果构建位置特异性分数矩阵,并用于第二次的搜索,第二次搜索结果用于第三次搜索,依此类推,直到找出最佳搜索结果。此外,BLAST不仅可用于检测序列对数据库的搜索,还可用于两个序列之间的比对。 尽管以下事实已经基本得到认同:基于序列模式的数据库搜索灵敏度较高、特异性较好,因而可以发现一些距离较远但却具有生物学意义的相似序列;它的不足之处也不能予以忽视。除了需要大量的计算资源这一缺点外,对于搜索结果的分析解释常常相当困难。这些制约因素限制了它的实际使用范围。 PSI-BLAST的基本思路在于根据最初的搜索结果,依照预先定义的相似性阈值将序列分成不同的组,构建一个位点特异性的序列谱,并通过多次叠代不断改进这一序列谱以提高搜索的灵敏度。 和其它叠代算法一样,PSI-BLAS方法既有不少长处,也有它的弊病。例如,如果在比对前不把胶原蛋白、同源多聚体等低复杂度的重复序列屏蔽掉,自动叠代搜索过程会因为这些重复序列的干扰而失败(Holm,1998)。假如第一轮的搜索结果出现一个错误序列,那么最终搜索结果中将会出现许多不期望的无关序列。因此,为了尽量去除大量的错误匹配,仔细分析搜索结果给出的同源关系变得非常重要。 BLAST算法 算法:做任何事情都有一定的步骤。为解决一个问题而采取的方法和步骤,就称为算法。 BLAST算法:快速高效的保证。 将查询序列分为多个短片段及相似片段; 筛选数据库以发现具备以上片段的序列; 将匹配序列进行延伸,插入和延伸gap,根据突变矩阵(BLOSUM62)计分排序; 返回分值最高的匹配序列 NCBI BLAST结果的评价 比对好坏的评价:Bit分值 考虑了比对中相同和相似基团、gap、替代矩阵,并经过标化; Bit分值越高,比对越好 比对统计学意义的评价:E值(E-value) E值越低,则比对就更有可能具有显著性 其他:比对的长度也是一个关键因素 解读BLAST的结果 header。给出查询序

文档评论(0)

awang118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档