网站大量收购闲置独家精品文档,联系QQ:2885784924

第5讲分子进化与系统发育分析.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 信息位点:能将所有可能的树区别出来的位点。 信息位点是指那些至少存在2个不同碱基/氨基酸且每个不同碱基/氨基酸至少出现两次的位点。 信息位点 上例 Position 5, 7, 9为信息位点; 基于position 5的三个MP树: Tree 1长度为1,Tree 2 3长度为2 Tree 1最为简约:总长=4 Tree 2长5;Tree 3长6 计算结果:MP tree的最优结果为tree 1 2. 距离法 又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。再依据进化距离,分别依次将序列合并聚类,构建进化树。 简单的距离矩阵 由进化距离构建进化树的方法有很多,常见有: (1) Fitch-Margoliash Method (FM法): 对短支长非常有效 (2) Neighbor-Joining Method (NJ法/邻接法):求最短支长,最通用的距离方法 (3) Neighbors Relaton Method(邻居关系法) (4) Unweighted Pair Group Method with Arithmetic Mean (UPGMA,非加权组平均法) 通过距离矩阵建树的方法 (1) Fitch-Margoliash方法 (FM法) = D和E最接近! D E ABC e d m 示例 分成三组:D, E, 以及ABC (1) FM法示例 DE距离=d+e=10 (1) D到ABC间的平均距离=d+m = 32.7 (2) E到ABC间的平均距离=e+m = 34.7 (3) (2)-(3)+(1) d=4,e=6 D E ABC e d m 分成三组:C, DE, 以及AB = C最接近DE! c+g+(e+d)/2=19 (1) c+f+(a+b)/2=40 (2) (e+d)/2+(a+b)/2+f+g=41 (2) (1)+(2)-(3) = c=9 = g=5 由:(a+b)/2+f+g+(d+e)/2=41 得:f=20 由:a+f+c=39 得:a=10,则b=12 N-J/邻接法 与FM方法非常类似 保证总的支长最短 总支长:a+b+c+d+e=314/4=78.5 找到距离最近的两个点 1.任意两个节点选为相邻序列的总支长计算公式: 2.计算SAB, SBC, SCD, SDE…等数值 3.该例中, SAB最小 把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程 计算A, B的分支长度 d=e=10/2=5 UPGMA法 c=19/2=9.5 g=c-d=9.5-5=4.5 a=b=22/2=11 A B (CDE) A - 22 39.5 B - - 41.5 (CDE) - - - (AB) (CDE) (AB) - 40.5 (CDE) - - f1+a=f2+c=40.5/2=20.25 f1=9.25 , f2=11.75 最大似然法 (ML) 最大似然法(maximum likelihood, ML): 最早应用于对基因频率数据的分析上 选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树; 在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长; 缺点:费时,每个步骤都要考虑内部节点的所有可能性 改进:启发式算法,分枝交换搜索等 构建进化树的一般原则 1. 可靠的待分析数据 2. 准确的多序列比对 3. 选择合适的建树方法: A. 序列相似程度高,MP首先 B. 序列相似程度较低,ML首先 C. 序列相似程度太低,无意义 4. 一般采用两种及以上方法构建进化树,无显著区别可接受 构建进化树的一般原则 (2) 选择一个或多个已知与分析序列关系较远的序列作为外类群; 外类群可以辅助定位树根; 外类群序列必须与剩余序列关系较近,但外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。 外类群(Outgroup) bacteria outgroup eukaryote eukaryote eukaryote eukaryote archaea archaea archaea 外类群 进化树的可靠性分析 单纯由预先获得的多序列比对结果数据所推导出的进化树有时并不一定可靠。 改进办法:引进一些统计分析来寻找更优的进化树,检验结果的可靠性。 最

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档