生物信息学序列比对.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

序列比对

生物序列的同源性指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。同源性

同源性直系同源旁系同源?

Beta-球蛋白alpha-球蛋白共同祖先-未知球蛋白

TheConceptsofOrthologyandParalogyOrthologsandParalogsaretwotypesofhomologoussequences.Orthologydescribesgenesindifferentspeciesthatderivefromacommonancestor.Orthologousgenesmayormaynothavethesamefunction.Paralogydescribeshomologousgeneswithinasinglespeciesthatdivergedbygeneduplication.

序列相似性的概念序列比对(aligment)是序列分析的基础,其他一切都建立在序列排比的基础上。ACGCTAGCGCTAGCTGCTAGCTAGACGCTAGCGCTAGCTGCTAGCTAGACGCTAGCGCAAGCTGCTAGCTAG________________________________

序列相似性的概念序列比对的目的序列排比是推导蛋白质二级结构的基础是初步蛋白质功能推断的基础可用于蛋白质三级结构的推导可用于推导进化树和解释种间亲缘关系用于分析分子水平的选择压力探测序列之间的相互作用探测启动子单元等

在对一个新测定的蛋白序列进行分析时,比如分析的结果是:这个序列与某种细菌的ATPase相似。这是否意味着这个未知序列就是一个ATPase?答案是不能确定的。

MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG-------------PRNGTIKIYENPARTFTRPYSAKNITIYKEND匹配率(identity)两个蛋白质有一定数量的氨基酸在排比的位点上是相同的,即如果38个氨基酸的蛋白质中15个位点相同,我们说它们39.4%相同(39.4%)

相似性(similarity)通常在某些位点上有一些氨基酸被另外一些化学物理特性相近的氨基酸所代替,这种突变可称为保守突变。将保守突变的因素考虑在内,就可以定义各种打分方案(scoringschemes)对两序列的相似程度打分,所得分值即代表其相似的程度。

同源性(homology)只有当两个蛋白质在进化关系上具有共同的祖先时,才可称它们为同源的。Beta-球蛋白alpha-球蛋白共同祖先-未知球蛋白

序列比较是如何进行的?要分析两个序列是否相似,必须首先作比对分析(alignment)。如何作排比分析?最基本的条件是对序列的相似性做定量分析,然后将序列进行排比,在排比中要用到gaps,insertions,substitutions。对gaps和insertions打分可用较简单的扣分方案,而substitutions的打分则比较复杂,必须先构建出一个计算机的算法矩阵(Matrix),再根据此方案对序列中氨基酸残基之间的差异或相似进行打分。

序列比较是如何进行的?要对两个序列进行排比,必须首先打出其相似性的定量分值,于是需要一个打分矩阵。打分矩阵(ScoringMatrices):给不同的氨基酸配对定义的一系列相似性分值。而一个突变打分方案(mutationdatamatrix)则是根据排比时序列中点突变的情况设计出的打分方案。对氨基酸配对相似性的尺度衡量,例如苯丙氨酸和异亮氨酸相似性的定量标准,可以以多种方式来定义。

序列比较是如何进行的?打分矩阵(ScoringMatrices)对氨基酸配对相似性的尺度衡量,例如苯丙氨酸和异亮氨酸相似性的定量标准,可以以多种方式来定义。因此,设计一个打分矩阵,首先必须确定用什么算法模型。在序列排比分析中,打分矩阵只是某个算法模型的量化表现,比对的结果只在该算法模型所划定的范围内有意义。

生物信息学发展的3个主要阶段萌芽期(60-70年代)形成期(80-90年代):高速发展期(2000-至今)以Dayhoff的替换矩阵和Neelleman-Wunsch算法为代表,它们实际组成了生物信息学的一个最基本的内容和思路:序列比较。它们的出现,代表了生物信息学的诞生(虽然“生物信息学”一词很晚才出现),以后的发展基本是在这2项内容上不断改善。

文档评论(0)

180****1080 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档