生物信息学5.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学5

生物信息学 第五章 分子系统发育分析 毛理凯 本课目录 总括 多序列比对 构建系统树 系统发生软件 一、总括 系统发生学(phylogenetics) 亦称系统学,种系发生学,种系发生系统学(phylogenetic systematics) 在希腊文中 phylon = tribe, race(种系) genesis = birth 研究生物群体(如:物种,种群)之间的进化关系 相关概念 phylogenetic taxonomy(系统发生分类学) 是系统学的一个分支 根据进化相关度对生物群体分类 phylogeny (=phylogenesis系统发生) 生物群体的产生和进化 分子系统学(molecular phylogenetics) 将核酸,氨基酸序列作为进化特征 系统发生树(phylogenetic tree) 也叫系统树,进化树(evolutionary tree),生命树(tree of life) 对物种之间的进化关系的一种描述,这些物种被认为有共同祖先 有根树和无根树 无根树和有根树的关系(1) 从一棵有根树总可以产生一棵无根树 而从无根树产生有根树需要额外的数据 无根树和有根树的关系(2) 一棵无根树可以产生多棵有根树 Willi Hennig (1913-1976) 德国生物学家,被认为是系统发生学和分类学(cladistics; 也叫cladogram)的奠基人 据已知资料来看,他的观点并不是最早被阐述 属达尔文学派;类似的观点另一学派的Lamarck和Rosa也有阐述 可以认为是系统发生学的集大成者 历史上的系统树 可能是最早的系统树 C. Darwin,1837 特征选取的变迁 经典系统发生学 主要是比较大的物理或表型特征 如生物体的大小,颜色,牙齿个数,行为特征 缺点: 不易量化(连续), 难以选取合适特征 现代系统发生学 分子水平: 核酸或氨基酸序列 优点: 易量化(离散),易获取,适于自动化,更本质 例子: (现代人起源) 通过对线粒体DNA的研究,认为所有现代人都是一个非洲女性的后代(“夏娃”) 系统发生学研究方法 目的 在树空间中寻找正确的系统树 分析步骤 多(重)序列比对(multiple sequence alignment, MSA) 构建系统树 评价结果 三种构建系统树中使用的搜索算法 穷尽法 搜索整个空间(所有可能的树),然后根据评价标准选择一棵最优的树 分支约束方法 根据一定的约束条件将搜索空间限制在一定范围内 启发式或经验性方法(heuristic) 根据目前的搜索情况指导下一步的搜索方向 根据先验知识或一定的指导性规则压缩搜索空间 两类数据: 距离和离散特征 距离 描述序列之间的差别 (遗传距离) 一般用距离矩阵(distance matrix)表示 距离往往由序列比对产生(如错配的比例) 离散特征 二态特征 (如: DNA序列上的某个位点是否剪切位点) 多态特征 (如: 某一位点可能的碱基有A,T,G,C) 两大类构建系统树的算法 基于距离的构建方法 (distance-matrix methods) 邻近归并法 (或称邻接法,neighbor-joining) 非加权组平均法 (UPGMA) Fitch-Margoliash法 最小进化方法 基于离散特征的构建方法 最大简约法 (MP) 进化简约法 (EP) 最大似然法 (ML) 相容性方法 注意: 系统树的限制 有人认为生物的系统关系不一定是树状的 系统树不一定代表进化历史 有很多干扰分析的因素 噪音(noisy) 水平基因转移(horizontal gene transfer;网状) 杂交,重组等 (网状) 用不同基因或蛋白产生的树往往不同 已经灭绝的物种只能作为叶节点 二、多序列比对 例子 多物种核糖体Rplp0蛋白比对 多序列比对方法 动态规划(dynamic programming) 慢,耗内存 改进: 使用“sum of pairs”目标函数 渐进法(progressive method;或称分级法hierarchical,建树法tree) 迭代法(iterative method) 基序法(motif finding;或称轮廓分析法profile analysis) 来自计算科学的算法 HMM, GA, SA 星形比对,树形比对 动态规划法 是两两比对所用动态规划方法的直接扩展 步骤 用两两比对的方法比对所有的序列对 建立n维矩阵(n为序列个数) 产生多序列比对 优点 理论上适用于任意多个序列 保证能得到较好结果 缺点 耗费大量时间,内存 实际上很少用于多于3个序列的比对 逐对加和法(sum of pairs, SP) 步骤 进行所有两两比对,并给每个比对打分 将所有的得分相加 找到最优多序列比对,

您可能关注的文档

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档