网站大量收购独家精品文档,联系QQ:2885784924

3-2,序列比对.pdf

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3-2,序列比对

生物信息学 生物信息学 第三章 序列比对 Ⅱ 本章内容提要 本章内容提要 第一节:双序列比对算法的介绍 Dot matrix 动态规划算法 (Needleman-Wunsch, Smith-Waterman算法) FASTA和BLAST算法 第二节:打分矩阵及其含义 第三节:多序列比对 第二节打分矩阵及其含义 第二节打分矩阵及其含义 1,计分方法 2 ,Dayhoff: PAM系列矩阵 3,Henikoff: BLOSUM系列矩阵 1,计分方法 1,计分方法 匹配计分: UM矩阵(Unitary matrix) 相同的氨基酸记1分,否则记0分。 BLAST中核酸比对 结构域性质计分: SGM矩阵(Structure-Genetic Matrix) 主要根据氨基酸的结构和化学性质的相似程度 来记分(如D和E,S和T ,V和I有很高的相似性) ,同 时还考虑密码子之间相互转换的难易程度。 可观测变换计分: PAM矩阵 (Point Accepted Mutation) BLOSUM矩阵 (BLOcks SUbstitution Matrix) 2,PAM系列矩阵 2,PAM系列矩阵 Margaret Dayhoff, 1978; 通过对物种进化的研究,根据一种氨基酸被 另一种氨基酸替代的频度而提出的,最常用 的是PAM250; 假设,蛋白质序列各部位进化的速率是均等 的;氨基酸变化频率不随进化时间改变,短 期进化历史内观察到的置换可以推广到较长 的历史。 Accepted point mutation (PAM): 可接受 的点突变,氨基酸的改变不显著影响蛋白质 的功能; PAM矩阵 PAM矩阵 71个蛋白质家族的1572种变化; 序列相似性 85% ; 功能同源的蛋白质 通过中性进化,引入 可接受的点突变;  进化模型: A. 基本假设:中性进化,Kimura,1968; B. 进化的对称性: A-B = B-A; C. 扩展性:通过对较短时间内氨基酸替代关系 的计算来计算较长时间的氨基酸替代关系; PAM1矩阵 PAM1矩阵 两个蛋白质序列的~1%氨基酸发生变化; 定义进化时间以氨基酸的变异比例为准, 而不是时间;因为各个蛋白质家族进化的速 度并不相等; PAM2 = PAM1*PAM1 PAM3 = (PAM1)3 PAM250= (PAM1)250 PAMn矩阵的构建 PAMn矩阵的构建  选取多个家族的相似性85%的保守序列;  根据匹配计分进行多重比对(不含空位) ;  以比对结果构建进化树,反映氨基酸替换关系 ;  计算每种氨基酸转换成其它氨基酸的次数;  计算每种氨基酸突变率;  计算每对氨基酸突变率,得到突变概率矩阵, 将此矩阵自乘n次;  将突变概率矩阵转化为PAMn矩阵。 Step 1: 统计氨基酸的替代 1. 对于同一个group内的蛋白质序列,统 计氨基酸出现的频率,以及替换的个数; fFY = 6 f = 1 FH fYF = 9 对20种氨基酸做类似统计 f 不一定等于f ij ji Step2: 计算i-j的相对突

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档