- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分子进化树解读
分成三组:C, DE, 以及AB = C最接近DE! c+g+(e+d)/2=19 (1) c+f+(a+b)/2=40 (2) (e+d)/2+(a+b)/2+f+g=41 (2) (1)+(2)-(3) = c=9 = g=5 由:(a+b)/2+f+g+(d+e)/2=41 得:f=20 由:a+f+c=39 得:a=10,则b=12 构建系统发育树:最大似然法 最大似然法(Maximum likelihood) 一类完全基于统计的系统发生树的构建方法 选取一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树 似然值是根据一些替换模型来对多序列比对中的每个碱基都进行估算后得到的 单个位点的似然值是指在核苷酸替代模型中该位点每个可能被取代或再现的概率和,将所有位点似然值相乘,就得到进化树的似然值 最耗时的计算方法 对于4条长度为10的序列 Step1:假设一种topology Add Your Text Step2:计算每个位点的似然值 L6(Tree1)=L61ХL62 Х … Х L66 L6(Tree2)=L61 × L62 × … × L66 似然值为: L6 (Tree) =L6 (Tree1) +L6 (Tree2) + … 对于第六个位点: Step 3:计算进化树的似然值 Step 4:取似然值最大的 The likelihood of the tree is L(Tree) =L1(Tree) ×L2(Tree) × … × L10 (Tree) 最大似然法是要解决这样一个问题:给定一组数据和一个参数待定的模型,如何确定模型的参数,使得这个确定参数后的模型在所有模型中产生已知数据的概率最大。通俗一点讲,就是在什么情况下最有可能发生已知的事件。 构建进化树的一般原则 (2) 1. 可靠的待分析数据 2. 准确的多序列比对 3. 选择合适的建树方法: A. 序列相似程度高,MP首先 B. 序列相似程度较低,ML首先 C. 序列相似程度太低,无意义 4. 一般采用两种及以上方法构建进化树,无显著区别可接受 * * * * * * * * * * * 最大简约法(maximumparsimony,MP) 根据信息位点提供的各序列间的替换情况,在所有可能的树中筛选含最小替换数的树的方法。 最大简约法(MP) 该方法的理论基础是奥卡姆剃刀原理,即如无必要,勿增实体(解释一个过程的最好的理论是所需假设数目最少的那一个)。 主要思想:构造一个反映分类单元之间最小变化的系统发育树,即选择核苷酸序列全部位点最小核苷酸替代数之和最小的树作为最优树。 MP法适用的问题 位点不存在回复突变、平行突变; 被分析的序列较长,核苷酸或氨基酸数目很大; 序列的相似度较高; 核苷酸或氨基酸替代速率较稳定。 最大简约法(MP) 最大简约法 构建有根树的具体步骤: 事先假定一个祖先序列(外类群outgroup) 列出所有能够描述这些序列之间关系的树 计算形成每棵发育树所需的代价(通常累计沿着每个分支特征变化的树) 外类群的要求: 外类群序列必须与待分析的其他序列关系较近(同源序列) 外类群序列与其他序列间的差异必须比其他序列之间的差异更显著。 外类群可以辅助定位树根 信息位点:能将所有可能的树区别出来的位点。 信息位点是指那些至少存在2个不同碱基/氨基酸且每个不同碱基/氨基酸至少出现两次的位点。 信息位点 (Sites are informative) Position 5, 7, 9为信息位点; 基于position 5的三个MP树: Tree 1替代数为1,Tree 2 3替代数为2 Tree 1最为简约 MP tree的最优结果为tree 1 如:用最大简约法构建下面4组序列的系统树 AAG AAA GGA AGA 它们是如何由AAA进化而来的? 最大简约法 AAG AAA GGA AGA AAA AAA 1 1 AGA AAG AGA AAA GGA AAA AAA 1 2 AAA AAG GGA AAA AGA AAA AAA 1 1 AAA 1 2 Cost = 3 Cost = 4 Cost = 4 1 选择替换代价最小的树 最大简约法 缺点:分析序列上存在较多的回复突变或平行突变,而被检验的序列位点数又比较少的时候,可能会给出一个不合理的或者错误的进化树推导结果。 优点:不需要在处理核苷酸或者氨基酸替代的时候引入假设 (替代模型) 基于距离法构建进化树 1 ) FM法 2) NJ法/邻接法 3) 非加权组平均法 4) 邻居关系法
您可能关注的文档
最近下载
- 最新石灰生产危险源辨识、风险分析资料.docx VIP
- 船体装配工培训.pptx
- 新版人教版七年级英语上册书面表达及范文.pptx
- 2023-2024学年山东省潍坊市九年级(上)期末物理试卷.docx
- 广东省广州市增城区2022-2023学年九年级上学期期末英语试题(答案).docx VIP
- 《审计基础》课程标准.pdf
- 2024-2025学年度南京市鼓楼区三年级语文第一学期期末真题模拟检测.docx
- 餐饮服务员岗位培训.pptx
- 寒假放假安全教育主题班会PPT.pptx VIP
- 沪教版(2024)七年级上册Unit 1 Friendship 语法 Grammar 特殊疑问句(含解析).docx VIP
文档评论(0)