- 1、本文档共162页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
系统发育分析完整版_3Fixed(Raindy)
Fujian Agriculture and Forestry University 生物信息学课程
系统发育分析
Phylogenetic Analysis
RAINDYOK@QQ.COM
2016.05
要求
会根据序列特征选择建树方法
掌握常见建树方法的规范操作
• NJ法(MEGA )
• ML法(MEGA、RaxmlGUI )
• BI法(Mrbayes )
本章纲要
Part 1. What is phylogenetic analysis ?
Part 2. Why do we perform phylogenetic analysis ?
Part 3. How to perform phylogenetic analysis ?
PART ONE What is phylogenetic analysis ?
01
系统发育的定义
系统发育(Phylogeny ),也叫系统发生,是指任何实体
(基因、个体、种群、物种等)的起源和演化关系。
将进化论的原理拓展到DNA水平和蛋白质序列水平,通过
多重序列比对 ,研究一组相关的基因或蛋白质,推断和评估不
同基因间的进化关系,其中包括分子进化(基因树)和物种进
化(物种树)。
多重序列比对
重建系统发育树
(最大似然法)
基因树与物种树的区别
基因树是根据DNA或蛋白质序列数据构建的系统树;
物种树是表达生物类群进化路径的系统树。
两者存在差异:
• 来自两不同物种的两个基因的分化时间可能早于物种的分化;
• 基因树的拓扑结构可能与物种树不完全一致
相似性与同源性的区别
相似性将待研究序列与已知DNA或蛋白质序列库进行比较,
找出与此序列相似的已知序列,反映是一种直接的数量关系;
常用的程序如BLAST、FASTA、Dot Plot等。
同源性是指从一些数据中推断出的两个基因或蛋白质序列
具有共同祖先的结论,属于质的判断。同源性分析中常常要
通过多重序列比对来找出序列之间的相互关系,常用的程序,
如Clustal-Alignment 等。
建树方法
邻接法(Neighbor-Joining, NJ )
最大似然法(Maximum Likelihood, ML )
最大简约法(Maximum Parsimony, MP )
贝叶斯法(Bayesian inference, BI )
邻接法(Neighbor-Joining, NJ )
特点 :
NJ 法是基于最小进化原理经常被使用的一种算法,它构建的树相对准确,
假设少,计算速度快 ,只得一颗树。
缺点 :
序列上的所有位点等同对待,且所分析的序列的进化距离不能太大。
适用 :
进化距离不大 ,信息位点少的短序列。
1 2 3
最大似然法(Maximum Likehood, ML )
原理 :
将每个位点所有可能出现的残基替换概率进行累加,产生特定位点的似
然值,对所有可能的系统发育树都计算似然函数,似然函数值最大的那颗树
即最可能的系统发育树。
优点 :
在进化模型确定的情况下 ,ML法是与进化事实吻合最好的建树算法。
缺点 :
计算强度非常大,极为耗时。
最大简约法(Maximum Parsimony, MP )
特点:
基于进化过程中碱基替代数目最少这一假说。
缺点:
推测的树不是唯一的,变异大的序列可能会导致建树错误。
适用:
序列残基差别小 ,具有近似变异率,包含信息位点比较多的长序列。
文档评论(0)