- 1、本文档共70页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3-2,序列比对
生物信息学
生物信息学
第三章 序列比对 Ⅱ
本章内容提要
本章内容提要
第一节:双序列比对算法的介绍
Dot matrix
动态规划算法
(Needleman-Wunsch, Smith-Waterman算法)
FASTA和BLAST算法
第二节:打分矩阵及其含义
第三节:多序列比对
第二节打分矩阵及其含义
第二节打分矩阵及其含义
1,计分方法
2 ,Dayhoff: PAM系列矩阵
3,Henikoff: BLOSUM系列矩阵
1,计分方法
1,计分方法
匹配计分:
UM矩阵(Unitary matrix)
相同的氨基酸记1分,否则记0分。
BLAST中核酸比对
结构域性质计分:
SGM矩阵(Structure-Genetic Matrix)
主要根据氨基酸的结构和化学性质的相似程度
来记分(如D和E,S和T ,V和I有很高的相似性) ,同
时还考虑密码子之间相互转换的难易程度。
可观测变换计分:
PAM矩阵 (Point Accepted Mutation)
BLOSUM矩阵 (BLOcks SUbstitution Matrix)
2,PAM系列矩阵
2,PAM系列矩阵
Margaret Dayhoff, 1978;
通过对物种进化的研究,根据一种氨基酸被
另一种氨基酸替代的频度而提出的,最常用
的是PAM250;
假设,蛋白质序列各部位进化的速率是均等
的;氨基酸变化频率不随进化时间改变,短
期进化历史内观察到的置换可以推广到较长
的历史。
Accepted point mutation (PAM): 可接受
的点突变,氨基酸的改变不显著影响蛋白质
的功能;
PAM矩阵
PAM矩阵
71个蛋白质家族的1572种变化;
序列相似性 85% ;
功能同源的蛋白质 通过中性进化,引入
可接受的点突变;
进化模型:
A. 基本假设:中性进化,Kimura,1968;
B. 进化的对称性: A-B = B-A;
C. 扩展性:通过对较短时间内氨基酸替代关系
的计算来计算较长时间的氨基酸替代关系;
PAM1矩阵
PAM1矩阵
两个蛋白质序列的~1%氨基酸发生变化;
定义进化时间以氨基酸的变异比例为准,
而不是时间;因为各个蛋白质家族进化的速
度并不相等;
PAM2 = PAM1*PAM1
PAM3 = (PAM1)3
PAM250= (PAM1)250
PAMn矩阵的构建
PAMn矩阵的构建
选取多个家族的相似性85%的保守序列;
根据匹配计分进行多重比对(不含空位) ;
以比对结果构建进化树,反映氨基酸替换关系
;
计算每种氨基酸转换成其它氨基酸的次数;
计算每种氨基酸突变率;
计算每对氨基酸突变率,得到突变概率矩阵,
将此矩阵自乘n次;
将突变概率矩阵转化为PAMn矩阵。
Step 1: 统计氨基酸的替代
1. 对于同一个group内的蛋白质序列,统
计氨基酸出现的频率,以及替换的个数;
fFY = 6
f = 1
FH
fYF = 9
对20种氨基酸做类似统计
f 不一定等于f
ij ji
Step2: 计算i-j的相对突
文档评论(0)