第5讲分子进化和系统发育分析
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 信息位点:能将所有可能的树区别出来的位点。 信息位点是指那些至少存在2个不同碱基/氨基酸且每个不同碱基/氨基酸至少出现两次的位点。 信息位点 上例 Position 5, 7, 9为信息位点; 基于position 5的三个MP树: Tree 1长度为1,Tree 2 3长度为2 Tree 1最为简约:总长=4 Tree 2长5;Tree 3长6 计算结果:MP tree的最优结果为tree 1 2. 距离法 又称距离矩阵法,首先通过各个物种之间的比较,根据一定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。再依据进化距离,分别依次将序列合并聚类,构建进化树。 简单的距离矩阵 由进化距离构建进化树的方法有很多,常见有: (1) Fitch-Margoliash Method (FM法): 对短支长非常有效 (2) Neighbor-Joining Method (NJ法/邻接法):求最短支长,最通用的距离方法 (3) Neighbors Relaton Method(邻居关系法) (4) Unweighted Pair Group Method with Arithmetic Mean (UPGMA,非加权组平均法) 通过距离矩阵建树的方法 (1) Fitch-Margoliash方法 (FM法) = D和E最接近! D E ABC e d m 示例 分成三组:D, E, 以及ABC (1) FM法示例 DE距离=d+e=10 (1) D到ABC间的平均距离=d+m = 32.7 (2) E到ABC间的平均距离=e+m = 34.7 (3) (2)-(3)+(1) d=4,e=6 D E ABC e d m 分成三组:C, DE, 以及AB = C最接近DE! c+g+(e+d)/2=19 (1) c+f+(a+b)/2=40 (2) (e+d)/2+(a+b)/2+f+g=41 (2) (1)+(2)-(3) = c=9 = g=5 由:(a+b)/2+f+g+(d+e)/2=41 得:f=20 由:a+f+c=39 得:a=10,则b=12 N-J/邻接法 与FM方法非常类似 保证总的支长最短 总支长:a+b+c+d+e=314/4=78.5 找到距离最近的两个点 1.任意两个节点选为相邻序列的总支长计算公式: 2.计算SAB, SBC, SCD, SDE…等数值 3.该例中, SAB最小 把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程 计算A, B的分支长度 d=e=10/2=5 UPGMA法 c=19/2=9.5 g=c-d=9.5-5=4.5 a=b=22/2=11 A B (CDE) A - 22 39.5 B - - 41.5 (CDE) - - - (AB) (CDE) (AB) - 40.5 (CDE) - - f1+a=f2+c=40.5/2=20.25 f1=9.25 , f2=11.75 最大似然法 (ML) 最大似然法(maximum likelihood, ML): 最早应用于对基因频率数据的分析上 选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树; 在最大似然法的分析中,所考虑的参数并不是拓扑结构而是每个拓扑结构的枝长,并对似然率求最大值来估计枝长; 缺点:费时,每个步骤都要考虑内部节点的所有可能性 改进:启发式算法,分枝交换搜索等 构建进化树的一般原则 1. 可靠的待分析数据 2. 准确的多序列比对 3. 选择合适的建树方法: A. 序列相似程度高,MP首先 B. 序列相似程度较低,ML首先 C. 序列相似程度太低,无意义 4. 一般采用两种及以上方法构建进化树,无显著区别可接受 构建进化树的一般原则 (2) 选择一个或多个已知与分析序列关系较远的序列作为外类群; 外类群可以辅助定位树根; 外类群序列必须与剩余序列关系较近,但外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。 外类群(Outgroup) bacteria outgroup eukaryote eukaryote eukaryote eukaryote archaea archaea archaea 外类群 进化树的可靠性分析 单纯由预先获得的多序列比对结果数据所推导出的进化树有时并不一定可靠。 改进办法:引进一些统计分析来寻找更优的进化树,检验结果的可靠性。 最
您可能关注的文档
- 第2章 SPC和控制图课件.ppt
- 第2章 电子政务和现代政府.ppt
- 第22讲 空间位置关系和证明.doc
- 第2章 生态环境和保护.ppt
- 第2讲总供给总需求和产出决定概论.doc
- 第33章性激素类药和避孕药.ppt
- 第2讲-地理空间参照系统和地图投影.ppt
- 第3章 个体质量和管理.doc
- 第2课 现代信息技术和生活.ppt
- 第2讲 描述统计—表格法和图形法.pptx
- 2025-2026学年科普版七年级下册英语Unit7 Being a Smart Shopper素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit10 Lending a Helping Hand素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit11 Rules Matter素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit12 Better Together素养测评卷(含答案).docx
- 2026年中考英语语法选择专题训练(含答案).docx
- 2026中考语文二轮学思并重,涵养君子之德论语十二章、虽有佳肴、大道之行也.docx
- 中考文言文常见文化常识梳理.docx
- 中考语文二轮:内修君子德外尽忠臣心诚子书出师表修身立德主题学习.docx
- 中考语文二轮:不一样的求学路一样的成长梦送东阳马生序劝学主题学习.docx
- 中考语文二轮:《陋室铭》《爱莲说》托物寓意主题学习.docx
最近下载
- 2025年江苏经贸职业技术学院单招职业适应性测试题库精编.docx VIP
- 2025年主管护师考点汇总.pdf VIP
- 论文:五轴联动加工机床总体结构及数控系统设计原版.doc VIP
- 第一章行业会计比较概述 .pdf VIP
- 2024-2025学年武汉警官职业学院单招《英语》预测复习及答案详解参考.docx VIP
- 新人教版四年级数学下册教学课件《小数的意义》.pptx VIP
- 2024商丘医学高等专科学校教师招聘考试真题及答案.docx VIP
- 潍坊市2026届高三(一模)物理试卷(含答案).pdf
- 工业和信息化部所属单位招聘54人备考题库含答案详解(考试直接用).docx VIP
- 2024年高考作文备考之三元关系漫画作文题“上止正”2篇高分范文.pdf VIP
原创力文档

文档评论(0)