《序列比对》课件.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第三章

序列比对

为什么要序列比对?基于同源物鉴定的功能预测基本假设:序列的保守性功能的保守性因为:蛋白质一般在三级结构的层面上执行功能;蛋白质序列的保守性决定于其编码DNA的保守性。

序列比对中的进化假设所有的生物都起源于同一个祖先;序列不是随机产生,而是在进化上,不断发生着演变;基本假设:序列保守性结构保守性注意:反之并不为真。结构保守性序列保守性

contents3.1概述3.2两条序列比对方法3.3多条序列比对方法

序列比对的概念01生物序列之间的关系023.1概述

⑴序列比对(Sequencealignment)序列比对是序列相似性分析的常用方法,又称序列联配。通过将两个或多个核酸序列或蛋白序列进行比对,显示其中相似的结构域,这是进一步相似性分析的基础。通过比较未知序列与已知序列的一致性或相似性,可以预测未知序列功能。序列比对的概念

两条序列比对(pairwisealignment)通过比较两条序列之间的相似区域和保守性位点,寻找二者之间可能的进化关系。

多重序列比对(multiplealignment)可构建HMM模型,搜索更多的同源序列构建进化的树的必须步骤比较基因组学研究两类:全局或局部的多序列比对不同物种中,许多基因的功能保守,序列相似性较高,通过多条序列的比较,发现保守与变异的部分

如果两个序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性的程度问题。这两条序列之间要么是同源的,要么是不同源的。所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。同源蛋白质的氨基酸序列具有明显的相似性,这种相似性称为序列同源性。同源性(homology)⑵同源性和相似性

相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。A相似性本身的含义,并不要求与进化起源是否同一,与亲缘关系的远近、甚至于结构与功能有什么联系。B当相似程度高于50%时,比较容易推测检测序列和目标序列可能是同源序列;而当相似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。C相似性(similarity)

⑶直系同源和旁系同源直系同源(orthology)是指不同物种内的同源序列,它们来源于物种形成时的共同祖先基因。在进化上起源于一个始祖基因并垂直传递(verticaldescent)的同源基因;分布于两种或两种以上物种的基因组;功能高度保守乃至于近乎相同,甚至于其在近缘物种可以相互替换;结构相似;组织特异性与亚细胞分布相似。

旁系同源(paralogy)基因是指同一基因组(或同一物种的基因组)中,由于始祖基因的加倍而横向/水平方向(horizontal)产生的几个同源基因。即:旁系同源是基因复制的结果,两份拷贝在一个物种的历史上时平行演化的。这样的基因就被称为旁系同源基因。

直系同源和旁系同源

直系与旁系的共性是同源,都源于各自的始祖基因。01其区别在于:02在进化起源上,直系同源是强调在不同基因组中的垂直传递,旁系同源则是在同一基因组中的横向加倍;03在功能上,直系同源要求功能高度相似,而旁系同源在定义上对功能上没有严格要求,可能相似,但也可能并不相似(尽管结构上具一定程度的相似),甚至于没有功能(如基因家族中的假基因)。04

序列比对的数学模型大体可以分为两类,一类从全长序列出发,考虑序列的整体相似性,即整体比对;第二类考虑序列部分区域的相似性,即局部比对。04寻找序列中相似度最高的区域,也就是匹配密度最高的部分。适用于在某些部分相似度较高,而其他部位差异较大的序列。如:Smith-Waterman算法05对序列从头到尾进行比较,试图使尽可能多的字符在同一列中匹配。适用于相似度较高且长度相近的序列如:Needleman-Wunsch算法01局部比对03全局比对02⑷序列比对的数学模型

局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。BLAST和FastA等常用的数据库搜索程序均采用局部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。局部相似性比对

3.2两条序列比对方法序列两两比对分析是最简单、最基本的对齐分析。三种方法:点阵分析法动态规划法:Needleman-Wunsch算法、Smith-Waterman算法词或K串法(BLASTorFAST

文档评论(0)

135****6917 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档