生物信息学分子系统发育分析.pptxVIP

  • 9
  • 0
  • 约1.1万字
  • 约 65页
  • 2021-10-23 发布于上海
  • 举报
会计学 1 生物信息学分子系统发育分析 2 本课目录 总括 多序列比对 构建系统树 系统发生软件 3 一、总括 4 系统发生学(phylogenetics) 亦称系统学,种系发生学,种系发生系统学(phylogenetic systematics) 在希腊文中 phylon = tribe, race(种系) genesis = birth 研究生物群体(如:物种,种群)之间的进化关系 5 相关概念 phylogenetic taxonomy(系统发生分类学) 是系统学的一个分支 根据进化相关度对生物群体分类 phylogeny (=phylogenesis系统发生) 生物群体的产生和进化 分子系统学(molecular phylogenetics) 将核酸,氨基酸序列作为进化特征 6 系统发生树(phylogenetic tree) 也叫系统树,进化树(evolutionary tree),生命树(tree of life) 对物种之间的进化关系的一种描述,这些物种被认为有共同祖先 叶,节点 关系,时间 7 有根树和无根树 有根树(rooted tree) 有共同祖先 无根树(unrooted tree) 树空间(tree space) 从已知序列可以产生许多系统树 来自几何 8 无根树和有根树的关系(1) 从一棵有根树总可以产生一棵无根树 而从无根树产生有根树需要额外的数据 9 无根树和有根树的关系(2) 一棵无根树可以产生多棵有根树 10 Willi Hennig (1913-1976) 德国生物学家,被认为是系统发生学和分类学(cladistics; 也叫cladogram)的奠基人 据已知资料来看,他的观点并不是最早被阐述 属达尔文学派;类似的观点另一学派的Lamarck和Rosa也有阐述 可以认为是系统发生学的集大成者 11 历史上的系统树 海克尔(Ernst Haeckel)首次制成了当时所有已知生物的系统树 (1834-1919)著名的德国生物学家,哲学家,医生,教授,艺术家 创建了重演论(recapitulation theory) 命名了许多生物学术语(如:门,系统发生,生态学,原生生物)和几千物种 出版了著名的Kunstformen der Natur (Artforms of Nature) 12 可能是最早的系统树 C. Darwin,1837 13 特征选取的变迁 经典系统发生学 主要是比较大的物理或表型特征 如生物体的大小,颜色,牙齿个数,行为特征 缺点: 不易量化(连续), 难以选取合适特征 现代系统发生学 分子水平: 核酸或氨基酸序列 优点: 易量化(离散),易获取,适于自动化,更本质 例子: (现代人起源) 通过对线粒体DNA的研究,认为所有现代人都是一个非洲女性的后代(“夏娃”) 14 系统发生学研究方法 目的 在树空间中寻找正确的系统树 分析步骤 多(重)序列比对(multiple sequence alignment, MSA) 构建系统树 评价结果 15 三种构建系统树中使用的搜索算法 穷尽法 搜索整个空间(所有可能的树),然后根据评价标准选择一棵最优的树 分支约束方法 根据一定的约束条件将搜索空间限制在一定范围内 启发式或经验性方法(heuristic) 根据目前的搜索情况指导下一步的搜索方向 根据先验知识或一定的指导性规则压缩搜索空间 16 两类数据: 距离和离散特征 距离 描述序列之间的差别 (遗传距离) 一般用距离矩阵(distance matrix)表示 距离往往由序列比对产生(如错配的比例) 离散特征 二态特征 (如: DNA序列上的某个位点是否剪切位点) 多态特征 (如: 某一位点可能的碱基有A,T,G,C) 17 两大类构建系统树的算法 基于距离的构建方法 (distance-matrix methods) 邻近归并法 (或称邻接法,neighbor-joining) 非加权组平均法 (UPGMA) Fitch-Margoliash法 最小进化方法 基于离散特征的构建方法 最大简约法 (MP) 进化简约法 (EP) 最大似然法 (ML) 相容性方法 18 注意: 系统树的限制 有人认为生物的系统关系不一定是树状的 系统树不一定代表进化历史 有很多干扰分析的因素 噪音(noisy) 水平基因转移(horizontal gene transfer;网状) 杂交,重组等 (网状) 用不同基因或蛋白产生的树往往不同 已经灭绝的物种只能作为叶节点 19 二、多序列比对 20 例子 多物种核糖体Rplp0蛋白比对 ClustalW生成(颜色表示氨基酸保守性) 21 多序列比对方法 动态规划(dynamic programming) 慢,耗内存 改进: 使用“sum of pa

文档评论(0)

1亿VIP精品文档

相关文档