基于距离系统发生分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4.4.3 距离变换法 除UPGMA法外,其他的一些基于距离矩阵的方法考虑了不同的家系有不同的进化速率,其中最简单的最早的算法是距离变换法。 这种方法充分利用了外群或外部参考物种——先于其他所有被考虑的物种 [内群或内部物种 (从它们的共同祖先中分化出来的那些物种)] 。 4.4.3 距离变换法 d’ij=(dij-diD-djD)/ 2+dD 公式中d’ij是物种i和j之间变换后的距离, dD是外部参考物种与全体内部物种之间的平均距离。 dD=ΣdiD / (n-1) 物种 A B C B 9 C 8 11 D 12 15 10 - - 四个物种两两进化距离(假设树可加) - A B C D 3 6 2 3 1 6 4.4.3 距离变换法 d’ij=(dij-diD-djD)/ 2+dD 公式中d’ij是物种i和j之间变换后的距离, dD是外部参考物种与全体内部物种之间的平均距离。 dD=ΣdiD / (n-1) 物种 A B C B 9 C 8 11 D 12 15 10 物种 A B B 10/3 C 16/3 16/3 - - 四个物种两两进化距离(假设树可加) 3个物种为内部物种,D为外部物种时的 距离矩阵 - 物种 A B C B 9 C 8 11 D 12 15 10 物种 A B B C dD=(dAD+dBD+dCD) / 3 = (12+15+10) / 3 = 37/ 3 - d’AB=(dAB-dAD-dBD) / 2 + dD = (9-12-15)/2+37/3=10/3 - 10/3 d’BC=(dBC-dBD-dCD) / 2 + dD = (11-15-10)/2+37/3=16/3 d’AC=(dAC-dAD-dCD) / 2 + dD = (8-12-10)/2+37/3=16/3 - - 16/3 16/3 4.4.4 近邻关系法 近邻关系法是由UPGMA法演变出的另一种常用的方法,强调配对物种,由此构造一棵分支长度总和最小的树。 任意一棵无根树中,仅被一个内部节点分隔的一对物种称为近邻。 D A B C a b c d e 四个物种 (A,B,C,D) 之间进化关系的通用系统发生树 上图中的系统发生树的拓扑结构给出了一些近邻间有用的代数关系,由于树是正确的且可加和,则下面的等式成立: dAC + dBD= dAD + dBC = a+b+c+d+2e = dAB + dCD+ 2e 下面的不等式也是成立的: dAB + dCD< dAC + dBD dAB + dCD< dAD + dBC 4.4.4 近邻关系法 ?例:1977年,S.Sattath和A.Tversky提出了一种用近邻关系法构建多于4个物种的树的方法。他们建立了一个距离矩阵,用矩阵中的值计算出针对前4个物种的3个数值:⑴ dAB + dCD ⑵ dAC + dBD ⑶ dAD + dBC。取和最小的两个配对打分为1,而其他的4个配对打分为0 。对数据集中所有可能的4个物种的组合都重复以上的步骤,不断累计得分。最后得分最高的一对物种聚为一组,即这两个物种是近邻,就像UPMGA法一样,得到一个新的距离矩阵,用新的距离矩阵开始新一轮的打分过程,直到只剩下3个物种(此时,树的拓扑结构已经明确确定了)。 4.4.5 邻近归并法 邻近归并法是对上面的方法做了一些改动。这类算法首先是由一棵星状树开始,不管数目多少,所有的物种都从一个中心节点出发,然后通过最小化树的分支长度和,相继找到近邻。 计算分支长度和公式: 1987年N.Saitou和M.Nei 提出 S12=(1/(2(N-2))(∑(d1k+d2k)+(1/2)d12+(1/N-2)(∑dij))) 式中树的1和2的位置可以使其中任何一对物种,N是距离矩阵中物种的数目 k 是引入外部参考物种, dij是物种 i 和 j 之间的距离; 1988年,J.Studier和K.Keppler提出一种快速算法: Q12= (N-2) d12 - ∑ d1i - ∑ d2i 4.5 最大似然法 最大似然法是另外一类完全基于统计的系统发生树重建方法的代表。该法在每组序列比对中考虑了每个核苷酸替换的概率。 例如,在第3章中我们已经知道,转换出现的概率大约是颠换的3倍。在一个三序列的比对中,发现其中有一列为一个C、一个T和一个G,有理由认为,C和T所在的序列之间的关系有可能更接近。最后根据定义,概率总和最大的那棵树最有可能是反映真实情况的系统发生树。 4

文档评论(0)

bhyq + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档