- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
序列 位点1 位点2 位点3 位点4 位点5 位点6 1 G G G G G G 2 G G G A G T 3 G G A T A G 4 G A T C A T 不变位点 非信息位点 非信息位点 非信息位点 信息位点 信息位点 ((1,2)(3,4)) ((1,4)(2,3)) ((1,3)(2,4)) T * 精品PPT·实用借鉴 信息位点的共同特征: 如果一个位点是信息位点,那么它(1)至少有两种不同的核苷酸,并且(2)这些核苷酸至少出现两次。 * 精品PPT·实用借鉴 5.1.2 无权简约法 最简约树:考虑每个信息位点所有可能的树,分别给每棵树进行打分,统计每个位点的核苷酸最小替换数目。所有简约信息位点最小核苷酸替换数的总和最小的树记为最简约树。 4条序列比对的例子可能是最简单的例子: 在只包含4条序列的分析中,每个信息位点只能支持 3 棵可能的树中的1棵,含有最多信息位点的树就是最简约树。 * 精品PPT·实用借鉴 5条或更多序列数据集的计算复杂得多。原因在于: ⑴ 随序列数增加,无根树数目也增加; ⑵ 每个信息位点可能有多棵树,整个数据集的最大简约树不一定是含最多信息位点的树; ⑶ 每棵树的核苷酸替换数目的计算更加困难。 n个物种可能得到无根系统发生树 (Nu) 数目: Nu=(2n-5)!/2n-3(n-3)! * 精品PPT·实用借鉴 下图是描述5条不同序列之间关系的15棵可能无根树中的3棵。这3棵无根树有相同的简约度,它们的最小替换数都是2。由简约规则,推断出的祖先的候选核苷酸分别列在每个内部节点的旁边。 T 5 1 2 3 4 6 7 8 9 G G A A G A (GA) (GAT) (a) A 1 2 3 4 5 6 7 8 9 G G T A G A (GT) (GTA) (b) 1 2 3 4 5 6 7 8 9 G T G A A G G A (GA) ( c ) 计算祖先核苷酸位置的算法: 如果一个内部节点的两个直接后代节点上的核苷酸的交集非空,那么这个节点的最可能的候选核苷酸集就是这个交集; 否则为它的两个后代节点上的核苷酸集的并集。 * 精品PPT·实用借鉴 构建系统进化树的方法 ——距离法 又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系 。 * 精品PPT·实用借鉴 构建系统进化树的方法 ——距离法 简单的距离矩阵 * 精品PPT·实用借鉴 由进化距离构建进化树的方法有很多,常见有: (1) Fitch-Margoliash Method (FM法): 对短支长非常有效 (2) Neighbor-Joining Method (NJ法/邻接法):求最短支长,最通用的距离方法 (3) Neighbors Relaton Method(邻居关系法) (4) Unweighted Pair Group Method (UPGMA法/非加权组平均法) 构建系统进化树的方法 ——距离法 * 精品PPT·实用借鉴 DE距离=d+e (1) D到ABC间的平均距离=d+m (2) E到ABC间的平均距离=e+m (3) (2)-(3)+(1) d=4,e=6 构建系统进化树的方法 ——FM法 * 精品PPT·实用借鉴 C最接近DE! 分成三组:C, DE, 以及AB 构建系统进化树的方法 ——FM法 * 精品PPT·实用借鉴 c+g+(e+d)/2=19 (1) c+f+(a+b)/2=40 (2) (e+d)/2+(a+b)/2+f+g=41 (2) (1)+(2)-(3) 得:c=9 构建系统进化树的方法 ——FM法 * 精品PPT·实用借鉴 c+g+(e+d)/2=19 (e+d)/2=5,c=9,则g=5 构建系统进化树的方法 ——FM法 * 精品PPT·实用借鉴 由:(a+b)/2+f+g+(d+e)/2=41 得:f=20 由:a+f+c=39 得:a=10,则b=12 构建系统进化树的方法 ——FM法 * 精品PPT·实用借鉴 1. 最大似然法(maximum likelihood, ML): 最早应用于对基因频率数据的分析上 2. 选取一个特定的替代模型来分析给定的一组序列数据,在每组序列比对中考虑每个核苷酸替换的
文档评论(0)