分子进化与系统发育分析.ppt

  1. 1、本文档共174页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

分子进化与系统发育分析;内容提要; 从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。

蛋白和核酸序列

通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律。;系统发育树是什么?;祖先节点/树根;A;分子进化研究的根底〔假设〕;

在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。〔分子钟理论,1965〕;

虽然很多时候仍然存在争议,但是分子进化确实能阐述一些生物系统发生的内在规律。;从一个分歧数据可以推测其他;速率恒定的证据:血色素;中性理论;进化及遗传模型;进化及遗传模型;直系同源(orthologs):同源的基因通过物种形成的事件而产生,或源于不同物种的最近的共同祖先的两个基因,或者两个物种中的同一基因,一般具有相同的功能。

并系同源(paralogs):同源基因在同一物种中,通过至少一次基因复制的事件而产生。;;paralogs;

以上两个概念代表了两个不同的进化事件

用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。;趋同进化的基因(Convergentevolution)

通过不同的进化途径获得相似的功能,或者功能替代物

(geneshaveconvergedfunctionbyseparateevolutionarypaths);异源基因或水平转移基因

(xenologousorhorizontallytransferredgenes)

由某一个水平基因转移事件而得到的同源序列;Bacterium1;archaea;无根树和有根树:潜在的数目;4.基因树,物种树;系统发育树重建分析步骤;1.最大简约法(maximumparsimony,MP)

2.距离法(distance)

3.最大似然法(maximumlikelihood,ML);最大简约法(MP);1.信息位点,必须在至少2个taxa中具有相同的序列性状

2.信息位点是指那些至少存在2个不同碱基/氨基酸且每个不同碱基/氨基酸至少出现两次的位点;;上例;2.距离法;计算序列的距离,建立距离矩阵;简单的距离矩阵;由进化距离构建进化树的方法有很多,常见有:

(1)Fitch-MargoliashMethod(FM法):对短支长非常有效

(2)Neighbor-JoiningMethod(NJ法/邻接法):求最短支长,最通用的距离方法

(3)NeighborsRelatonMethod(邻居关系法)

(4)UnweightedPairGroupMethod(UPGMA法);1.找出关系最近的序列对,如A和B

2.将剩余???序列作为一个简单复合序列,分别计算A、B到所有其他序列的距离的平均值

3.用这些值来计算A和B间的距离

4.将A、B作为一个单一的复合序列AB,计算与每一个其他序列的距离,生成新的距离矩阵

5.确定下一对关系最近的序列,重复前面的步聚计算枝长

7.从每个序列对开始,重复整个过程

8.对每个树计算每对序列间的预测距离,发现与原始数据最符合的树;Fitch-Margoliash方法(FM法);D和E最接近!;DE距离=d+e(1)

D到ABC间的平均距离=d+m(2)

E到ABC间的平均距离=e+m(3)

(2)-(3)+(1)

d=4,e=6;C最接近DE!;c+g+(e+d)/2=19(1)

c+f+(a+b)/2=40(2)

(e+d)/2+(a+b)/2+f+g=41(2)

(1)+(2)-(3)

得:c=9;c+g+(e+d)/2=19

(e+d)/2=5,c=9,那么g=5;由:(a+b)/2+f+g+(d+e)/2=41得:f=20

由:a+f+c=39得:a=10,那么b=12;NJ法/邻接法;NJ/邻接法;找到距离最近的两个点;把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程;AB组合出现3次,DE组合出现3次,CD、AC、BC组合各一次,那么AB和DE各为两对关系最近的邻居。(关系最近的邻居作为邻居的次数最多),将邻居看成一个新的复合序列,重复这个过程;UPGMA法;d=e=10/2=5;c=19/2=9.5

g=c-d=9.5-5=4.5;a=b=22/2=11;;最大似然法(ML);构建进化树的一般原那么;;1.进化树的可靠性分析:自展法(BootstrapMethod)

从排列的多序列中随机有放回的抽取某一列,构成相同长度的新的排列序列

2.重复上面的过程,得到多组新的序列

3.对这些新的序列进行建树,再观察这些树与原始树是否有差

文档评论(0)

展翅高飞2020 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档