基因树与物种树的关系及建树方法.docVIP

基因树与物种树的关系及建树方法.doc

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基因树与物种树的关系及建树方法.doc

基因树和物种树的关系及建树方法 一 .基因树和物种树 概念 二者关系 二 构建基因树或分子树 同源DNA排序问题 分子生物学数据类型(2种类型) 数据转换 建树方法(主要介绍四种方法) 非加权组平均法(UPGMA法) 邻接法(NJ法) 最大简约法(MP法) 最大似然法(ML法) 几种建树方法的比较 一 基因树和物种树 gene tree 分子树(molecular tree): 依据分子数据构建的反映分子系统发育的树 物种树(species tree): 反映物种实际种系发生的树 系统发育(Phylogeny):是指一群有机体发生或进化的历史. 系统发育树(Phylogenetic tree): 就是描述这一群有机体发生或进化顺序的拓朴结构。根据系统发育树的具体表达形式,可分为 基因树(Gene tree): 当一个分子系统树是根据某一个基因数据构建而来的,称为基因树. 物种树(Species tree): 是指代表一组物种进化过程的系统树. 基因树与物种树的关系 分子系统学的目的,就是通过分子树来推测物种树. 在许多情况下这两者是一致的 但是下列一些因素可能会造成分子树与物种树相偏离. A. 遗传渗漏 即 DNA跨越物种界限的转移. 如果在构建分子树是采用的是从其它物种水平转移而来的DNA序列,其结果与物种树大相径庭. B.祖先多态性 例如 a,b两物种的共同祖先c在某个位点c是多态的(c1,c2), 在进化的过程中c1演化成a1和b1;c2演化成a2和b2,若依据a1和b1,则推测的祖先为c1,如依据的祖先为a2和b2,侧推测的祖先为c2,这样a,b具有两个祖种,显然不符.原因在于基因的进化早于物种的分化. 为避免上述因素的影响,在分子系统研究中应尽可能分析互不连续的基因位点。 mtDNA在基因进化中是整个转移的 ,所以即使分析多个线立体基因,亦不能排除影响. 基因树与物种树存在两方面的区别: (1)对于某一被研究的基因,可能存在种内多态性,即在物种分化之前,该基因可能已经开始分化。所以两物种间该基因的分化时间可能早于这两个物种的分化的时间。由这一基因计算而来的分支长度(分歧时间)可能偏离. (2) 基因树的分支情况(拓扑结构)可能不同于物种树。 这种情况一般发生在分支点非常接近的物种间。例如 人 猩猩和黑猩猩间的关系。通过增加DNA序列的长度并测定多个相互独立的基因片段,一般可以避免这种问题的发生。 由于物种的进化历史不可能再现,所以不可能重建绝对完整的历史,同样也不可能获取绝对的物种树。但是通过多基因,大量DNA序列的正确分析,可以最大限度地缩小基因树与物种树间的差别。在这种情况下获得的系统树可被接受为物种树。 O A B C D 二 构建基因树(分子树) 1.同源DNA序列的排序(Alignment)问题 建立数据矩阵之前,必须获得具体的特征数据,所以要确定同源大分子相对应的位点,系统分析的前提是:不仅分析对象(大分子)是同源的,而且所比较的位点也是同源的,即分析对象的某一个位点必须能够确定可以追溯到共同祖先的同一位点. 对两个同源DNA序列的比较,首先要确定他们从最近的共同祖先分离后,各序列中缺失/插入所发生的位置以及与同源部分的对应关系,这个过程叫排序(比对)。 对于编码蛋白质区域而言,由于蛋白质功能上的需要和三联体密码结构的限制,缺失/插入很少发生或发生后很容易被选择淘汰。因此,一般比较容易比对。 而在非编码区域,缺失/插入发生的频率可能很高。在这种情况下,比对过程变得十分复杂,一般必须借助于计算机。各种主要的DNA序列分析软件中,如PC/GENE,GCG和MacVector等,都有DNA排序功能。根据经验,如果DNA同源度低于70%—75%,就不容易获得确定的排序。Clustal w x 不同的排序代表了不同的进化途径。采用不同的比对,可能得到完全不同的系统树。 一种稳定的方法是,删除涉及缺失/插入的序列片段。但是,有时缺失/插入可能代表重要的进化信息,简单的删除并不可取。 建议,如果存在多种合理的排序,而不同的排序又得到不同的系统树,就应该再测定另一个独立的DNA序列,根据这段序列得到的系统树判断究竟哪个排序更为合理。如果无法得到新的序列,增加外源物种可能有助于问题的解决。 例如:DNA同源序列a和b的排序 b CGTAGTCATGAC a CGATAGTTCCATGGC b1 CG- TAGT - - CATGAC b2 CG- TAG -T - CATGAC b3 C- GATGT -

文档评论(0)

dmz158 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档