序列比对和数据库搜索.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
序列比对和数据库搜索 生物医学工程中心2008级 余琪琪 序列两两比对 序列比对的理论基础是进化学说,如果两个序列之间具有足够的相似性,就推测二者可能有共同的进化祖先,经过序列内残基的替换、残基或序列片段的缺失、以及序列重组等遗传变异过程分别演化而来。 序列相似和序列同源是不同的概念,序列之间的相似程度是可以量化的参数,而序列是否同源需要有进化事实的验证。 任何序列之间均存在相似,只有当序列是从一个共同祖先进化分歧而来的,它们才是同源的。 SEQ1:AATTGATTGCGCATTTAAAGGG SEQ2:AACTGA CGCATCTTAAGGG 序列相似性分析一般使用两种动态规划算法。即Needleman-Wunsch 算法(全局联配) 和Smith-Waterman算法(局部联配) 。 空位罚分是为了补偿插入和缺失对序列相似性的影响,由于没有什么合适的理论模型能很好地描述空位问题,因此空位罚分缺乏理论依据而更多的带有主观特色。 序列1: MILVKP - VVLKGDFG 序列2: MILLKP A I I I RAEY- 数据库搜索:FASTA和BLAST Genbank、SWISS-PROT等序列数据库提供的序列搜索服务都是以序列两两比对为基础的。不同之处在于为了提高搜索的速度和效率,通常的序列搜索算法都进行了一定程度的优化,如最常见的FASTA工具和BLAST工具。它们通常要比动态规划法快上5-50倍。与动态规划法不同的是这些方法并不能保证找得到最佳联配,因此它们的准确性比较低。但在实际应用中,增加的运算速度往往能够弥补精度上的不足。 统计分值 序列相似性搜索的一个重大突破就是发展了联配分值的统计学原理。 在序列相似性搜索中, p值是指获得至少与两条不相关序列间的偶然相似性一样高的分值的概率。低p值表明有意义的 匹配:在这些情况下,分值几乎不可能是偶然得到的,而只可能是由真实的生物学或进化学关系得出。 E(期望)值是至少与所识别的相似性记同样高分值的偶然事件的期望频率。 两序列间相似度低p值对应于大数据库搜索的高E值。 敏感性和特异性 敏感性和特异性评价数据库搜索结果的最佳标准是两个互补的测度。 假如E或p的阈值已经选定,则认为比阈值低的E或p值的序列相似度是由意义的。通常我们把有意义的相似序列叫做击中项。数据库搜索把数据库分割成两个子集。击中项(阳性)和非击中项(阴性)。 敏感性是指以击中项的形式显示出来的真实生物序列关系在数据库中的比例,可以记为: Sn=ntp/(ntp+nfn) 其中ntp为真阳性的数目,nfn为假阴性的数目。 特异性是指击中项中具有真实生物学关系的击中项比例。可以记为: Sp=ntp/(ntp+nfp) 其中nfp为假阳性的数目 PSI-BLAST BLAST的当前版本是2.0,它的新发展是位点特异性反复BLAST(PSI-BLAST)。PSI-BLAST是一种迭代的搜索方法,可以提高BLAST和FASTA的相似序列发现率。每次迭代都发现一些中间序列,用来在接下去的迭代中寻找查询序列的更多疏远相关序列。即PSI-BLAST每次用profile搜索数据库后再利用搜索的结果重新构建profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。 PSI-BLAST的潜在问题是存在不相关序列对迭代结果的污染,而其难点则与蛋白质的结构域有关。 PSI-BLAST常常可以找到比BLAST结果多达两倍的进化关系。 NCBI的BLAST网址是:/BLAST/ 人Nanog基因前60个基因序列: attataaatc tagagactcc aggattttaa cgttctgctg gactgagctg gttgcctcat 多序列比对 顾名思义,多序列比对就是把两条以上可能有系统进化关系的序列进行比对的方法。目前对多序列比对的研究还在不断前进中,现有的大多数算法都基于渐进的比对的思想,在序列两两比对的基础上逐步优化多序列比对的结果。 当

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档