网站大量收购独家精品文档,联系QQ:2885784924

分子进化和系统发育分析.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
系统发育学研究的是进化关系,系统发育分析就根据同源性状的分歧来推断或者评估这些进化关系。通过系统发育分析所推断出来的进化关系一般用分枝图(进化树) 来描述,这个进化树描述了分子(基因树)、物种以及二者之间遗传关系的谱系。由于“Glade”这个词(拥有共同祖先的同一谱系)在西腊文中的本意是分支,所以系统发育学有时被称为遗传分类学(cladistics) 。 在 现代系统发育研究中,重点己不再是生物的形态学特征或其他特征,而是生物大分子尤其是序列,对序列的系统发育分析又称为分子系统学或分子系统发育研究。它 的发展得益于大量序列的测定和分析程序的完善。比起许多其他实验性学科,分子系统学与其他进化研究一样有其局限,即系统发育的发生过程都是己经完成的历 史,只能在拥有大量序列信息的基础上去推断过去曾经发生过什么,而不能再现。由于系统发育分析不太可能拥有实验基础,至多是些模拟实验或者病毒实验:如何处理序列从中得到有用信息、如何用计算的办法得到可信的系统树、如何从有限的数据得到进化模式成为这个领域的研究热点。 1进化树构建 构 建进化树的方法包括两种:一类是基于序列类似性比较,主要是基于氨基酸/核酸相对突变率矩阵计算不同序列差异性积分作为它们的差异性量度而构建的进化树; 另一类是在难以通过序列比较构建进化树的情况下,通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立的进化树。 2评估进化树和数据 现 在己经有一些程序可以用来评估数据中的系统发育信号和进化树的健壮性。对于前者,最流行的方法是用数据信号和随机数据作对比实验(偏斜和排列实验):对于 后者,可以对观察到的数据重新取样,进行进化树的支持实验(非参数自引导和对折方法)。似然比例实验可以对取代模型和进化树都进行评估。本文只阐述几个常 用的方法: 偏斜实验(Skewness Test):统计的临界值随着分类群数口的不同和序列中点的不同而不同,对随机数据集呈现的信号很敏感,可以用来决定系统发育信号是否保留着。 排列实验(PTP, permutation tail probability):对MP树的分值和那些通过对每一个位点都进行大量排列组合而得到的数据所推算出来的进化树的分值进行比较,从而决定在原始数据中是否存在系统发育信号。 自引导评估(bootstrap ): Bootstrap是由Felsenstein (1985)引入分子分类领域的,现己成为分析分子树置信区间最常用的方法。其原理是假定某序列Ao有N个位点,Bootstrap复制时从Ao中随机取 N个位点。Ao中的某些位点可能被随机遗漏,而某些位点则可能取到不仅一次,由此组成一个新序列A1。对一组数据复制n次,则可得到Ao衍生的n组数据。 由此可构建n个分子树,根据“多数规则”( majority rule)从这n个分子树中统计得到一致树(consensus tree ),一致树中各分支结构在n个分子树中出现的比率便表示原始数据对该结构的支持率。 可以对任何建树方法进行评估。模拟研究表明,在合适的条件下也就是各种替换速率基本相等,树枝基本对称的条件下,如果自引导数值大于70,那么所得的系统发育进化树能够反映真实的系统发生史的可能性要大于95 % 。 3 线性树(Linearized Tree) 在 进化中,虽然核酸或氨基酸的替代绝不会是严格恒定的,但是在估计序列间分歧时间方面,分子钟依然有用。当今我们对物种间的分歧时间或基因重复事件发生的时 间仍知之甚少,因此为了理解进化过程,即便粗略地估计分歧时间也是十分重要的。排除比平均速率显著慢或快的谱系,并对剩余的谱系按分子钟假说构建进化树, 就有可能估计不同谱系对间或不同序列对间粗略的分歧时间。按此途径构建的树称为线性树。线性树始终遵循分子钟假说。线性树的构建分如下几个步骤:(1)用 无需速率恒定假说的构树法对一组序列构建可靠的树,并用外类群序列定出树根。(2)对所用序列检验速率恒定假说,并删除与平均速率有显著偏差的序列。 (3)用速率恒定假说对剩余的序列重建一棵系统树。(4)如果己知某一序列对的分歧时间和序列分歧度,则能标定进化时间。 进化树的构建方法 1 建立数据模型 建 立一个比对模型的基本步骤包括:选择合适的比对程序,然后从比对结果中提取系统发育的数据集,至于如何提取有效数据,取决于所选择的建树程序如何处理容易 引起歧义的比对区域和插入/删除序列(即所谓的空位状态)。一个典型的比对过程包括:首先应用CLUSTALW程序及类似程序,进行多序列比对,最后提交 给一个建树程序。这个过程有如下特征选项:①部分依赖于计算机;②需要一个先验的系统发育标准(即需要一个前导树);③使用先验评估方法和动态评估方法对 比对参数进行评估;④对基本结构(序列)进行比对;⑤应用非统计数学优化。这

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档