- 1、本文档共55页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
5.3.2 启发式搜索 对大于20条序列的多序列进行比对必须采用近似的更为有效的算法。它并不一定总能找到最简约的树。 启发式(heuristic)方法的假设:各个可能的树并不总是相互独立的。 最简约数和次简约数拓扑结构相似,因此首先构建一棵初始树,从它开始寻找更短的树。 因此启发式搜索通过子树分支交换,把它们嫁接到该步分析中找到的最好的那棵树的其他位置上,从而产生一棵拓扑结构和初始树相似的树。 同分支约束法一样,如果初始树很接近于最简约树(例如UPGMA产生的树),启发式搜索会更有效。 图5.5 分支交换 再接 1 2 3 4 5 6 7 剪除 1 2 4 5 6 7 3 第一轮分析中,由初始树产生出上百棵新树,其中所有比初始树短的新树都在第二轮分析中被剪枝和嫁接。不断重复这个过程,直到某一轮通过剪枝和嫁接无法产生与前一轮等长或更短的树。 大量序列比对的可能的无根树的数目是一个天文数字,这种比对深度对计算造成了很大困难,把多个序列比对分成几个较少序列的比对可以较好的解决这一问题。 例如: 同源哺乳 动物序列 灵长类序列 啮齿类序列 部分偶蹄、兔类、 灵长、啮齿 探知树中灵长类 所在树干的末段 之间的关系 确定树中啮齿类 所在树干的末段 之间的关系 检验更早的分支、 更具体的灵长类 树干和啮齿类树干的 最后位置 5.4 一致树 简约法产生多棵等价的简约数是很常见的。 此时最简单的方法是用一个一致树 (consensus tree)作为代表来概括所有等价的简约树。方法如下: (1)在所有树中都一致的分支点在一致树中表示成二叉分支点。 (2)不一致的分支点蜕变成连接三个或更多后代分支的内部节点。 严格一致树 (strict consensus tree):只要有一棵简约树与其他不同,对所有不一致的分支点都进行相同的处理。 过半截定一致 (50% majority-rule consensus) :只要有至少一半的树符合条件,这个内部节点在一致树中就可以表示成二叉节点,而少于一半的树符合条件的内部节点表示为多叉节点。 不一致性阈值是一个参数,可以取0 ~100%的任意值。 由一个数据集推断出的3棵树 7 7 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 7 1 2 3 4 5 6 7 过半截定一致原则 7 严格一致原则 1 2 3 4 5 6 5.5 树的置信度 所有的系统发生树都是关于组成数据集的序列的进化历史的假设。 系统发生树的可靠性? 问题: (1)整棵树和它的组成部分(分支)的置信度是多少? (2)这样得到正确的树的可能性比随机选出一棵是正确的树的可能性大多少? 解决方法: 解决问题(1)——自举检验 解决问题(2)——参数检验 5.5.1 自举检验 (bootstrap test) 自举检验是一种重采样技术,能粗略地量化这些置信度水平。 自举检验的基本方法是: (1)从原数据集中抽取(同时替换)部分数据组成新的数据集。 (2)用这个新的数据集 推断 系统发生树。 重复上述过程,产生成百上千的重采样数据集,并同时生成对应的自举树,进而检验自举树对最终系统发生树各个分支的支持率。 在各个自举树中都有出现或大量出现的那些部分将具有较高的置信度。产生相同分组的自举树的数目常常标注在系统发生树相应节点的旁边,表示树中每个部分的相对置信度。 系统发生树的自举检验 序列 Ⅳ 位置 Ⅰ Ⅱ Ⅲ Ⅴ 推断树 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 自举树1 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 自举树2 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 自举树3 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ (a) (b) 自举树 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ (c) 为3个重采样数据集的一致树 75 67 G G G G G G G A A A G G G A G G G A A A G G G T A A A A A T G A A C A A A G G T G T T C A A A A A T 1 2 2 4 5 5 5 7 7 10 G G G G G G A T T T G G G A T T A T T T A A A T G G A C C C T T T C T T G T T T T T T C T T A T T T 3 3 3 4 6 6 7 8 8 8 G G G G G G G C C C G G G G G G T C C C G G A A A A G A A A G G T A A A T A A A G G T A A A T C C C 1 1 3 5 5 5 6 9 9 9 G G G G G G A T C A G G G A G T A T C A G G A T A G A C A T G A
您可能关注的文档
- 时间管理培训讲座分析.ppt
- 护士长培训模板分析.ppt
- 中医饮食养生8.2分析.ppt
- 时间管理培训教材分析.ppt
- 护士长述职复制分析.ppt
- 时间管理培训教材计划与合理安排(页)分析.ppt
- 中医饮食养生分析.ppt
- 中医营养学Chap2基本观念食物的性能饮食的作用分析.ppt
- 洛矿提升机介绍分析.ppt
- 时间管理培训教程分析.ppt
- 2025年山东省枣庄市行政职业能力测验模拟试题完整.docx
- 2025年山东省济南市行政职业能力测验题库附答案.docx
- 2025年山东省东营市选调生考试(公共基础知识)综合能力题库汇编.docx
- 2025年山西林业职业技术学院单招语文测试题库学生专用.docx
- 2025年山东省滨州地区单招(语文)测试模拟题库及参考答案一套.docx
- 2025年常州工程职业技术学院单招(语文)测试题库标准卷.docx
- 2025年山东电子职业技术学院单招语文测试题库完整.docx
- 2025年山西管理职业学院单招语文测试模拟题库完整.docx
- 2025年山西省晋中市单招(语文)测试模拟题库一套.docx
- 2025至2030中国急性冠脉综合征(ACS)行业项目调研及市场前景预测评估报告.docx
最近下载
- 储能电站项目可行性研究报告.docx
- 2024重庆公共运输职业学院招聘7人笔试备考题库及答案解析.docx VIP
- 华为IPD流程管理体系L1-L5最佳实践及落地实施.pptx VIP
- 铁路内燃机车司机高级技师理论题库(含答案).docx VIP
- 2026届高三语文开学第一课.pptx VIP
- 最新:脑卒中后吞咽障碍患者进食护理——2023中华护理学会团体标准课件.pptx VIP
- 2025重庆公共运输职业学院招聘13人笔试备考试题及答案解析.docx VIP
- 动词过去式不规则变化.doc VIP
- “十八项医疗质量安全核心制度”知识竞赛.docx VIP
- 2024重庆公共运输职业学院招聘1人笔试备考试题及答案解析.docx VIP
文档评论(0)