- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生物信息学5
生物信息学第五章 分子系统发育分析 毛理凯 本课目录 总括 多序列比对 构建系统树 系统发生软件 一、总括 系统发生学(phylogenetics) 亦称系统学,种系发生学,种系发生系统学(phylogenetic systematics) 在希腊文中 phylon = tribe, race(种系) genesis = birth 研究生物群体(如:物种,种群)之间的进化关系 相关概念 phylogenetic taxonomy(系统发生分类学) 是系统学的一个分支 根据进化相关度对生物群体分类 phylogeny (=phylogenesis系统发生) 生物群体的产生和进化 分子系统学(molecular phylogenetics) 将核酸,氨基酸序列作为进化特征 系统发生树(phylogenetic tree) 也叫系统树,进化树(evolutionary tree),生命树(tree of life) 对物种之间的进化关系的一种描述,这些物种被认为有共同祖先 有根树和无根树 无根树和有根树的关系(1) 从一棵有根树总可以产生一棵无根树 而从无根树产生有根树需要额外的数据 无根树和有根树的关系(2) 一棵无根树可以产生多棵有根树 Willi Hennig (1913-1976) 德国生物学家,被认为是系统发生学和分类学(cladistics; 也叫cladogram)的奠基人 据已知资料来看,他的观点并不是最早被阐述 属达尔文学派;类似的观点另一学派的Lamarck和Rosa也有阐述 可以认为是系统发生学的集大成者 历史上的系统树 可能是最早的系统树 C. Darwin,1837 特征选取的变迁 经典系统发生学 主要是比较大的物理或表型特征 如生物体的大小,颜色,牙齿个数,行为特征 缺点: 不易量化(连续), 难以选取合适特征 现代系统发生学 分子水平: 核酸或氨基酸序列 优点: 易量化(离散),易获取,适于自动化,更本质 例子: (现代人起源) 通过对线粒体DNA的研究,认为所有现代人都是一个非洲女性的后代(“夏娃”) 系统发生学研究方法 目的 在树空间中寻找正确的系统树 分析步骤 多(重)序列比对(multiple sequence alignment, MSA) 构建系统树 评价结果 三种构建系统树中使用的搜索算法 穷尽法 搜索整个空间(所有可能的树),然后根据评价标准选择一棵最优的树 分支约束方法 根据一定的约束条件将搜索空间限制在一定范围内 启发式或经验性方法(heuristic) 根据目前的搜索情况指导下一步的搜索方向 根据先验知识或一定的指导性规则压缩搜索空间 两类数据: 距离和离散特征 距离 描述序列之间的差别 (遗传距离) 一般用距离矩阵(distance matrix)表示 距离往往由序列比对产生(如错配的比例) 离散特征 二态特征 (如: DNA序列上的某个位点是否剪切位点) 多态特征 (如: 某一位点可能的碱基有A,T,G,C) 两大类构建系统树的算法 基于距离的构建方法 (distance-matrix methods) 邻近归并法 (或称邻接法,neighbor-joining) 非加权组平均法 (UPGMA) Fitch-Margoliash法 最小进化方法 基于离散特征的构建方法 最大简约法 (MP) 进化简约法 (EP) 最大似然法 (ML) 相容性方法 注意: 系统树的限制 有人认为生物的系统关系不一定是树状的 系统树不一定代表进化历史 有很多干扰分析的因素 噪音(noisy) 水平基因转移(horizontal gene transfer;网状) 杂交,重组等 (网状) 用不同基因或蛋白产生的树往往不同 已经灭绝的物种只能作为叶节点 二、多序列比对 例子 多物种核糖体Rplp0蛋白比对 多序列比对方法 动态规划(dynamic programming) 慢,耗内存 改进: 使用“sum of pairs”目标函数 渐进法(progressive method;或称分级法hierarchical,建树法tree) 迭代法(iterative method) 基序法(motif finding;或称轮廓分析法profile analysis) 来自计算科学的算法 HMM, GA, SA 星形比对,树形比对 动态规划法 是两两比对所用动态规划方法的直接扩展 步骤 用两两比对的方法比对所有的序列对 建立n维矩阵(n为序列个数) 产生多序列比对 优点 理论上适用于任意多个序列 保证能得到较好结果 缺点 耗费大量时间,内存 实际上很少用于多于3个序列的比对 逐对加和法(sum of pairs, SP) 步骤 进行所有两两比对,并给每个比对打分 将所有的得分相加 找到最优多序列比对,
您可能关注的文档
- 河北专版九年级英语全册Unit5Whataretheshirtsmadeof第2课时习题课件新版人教新目标版2.ppt
- 河北专版九年级英语全册Unit5Whataretheshirtsmadeof第4课时习题课件新版人教新目标版2.ppt
- 河北专版九年级英语全册Unit5Whataretheshirtsmadeof第3课时习题课件新版人教新目标版2.ppt
- 河北专版九年级英语全册Unit5Whataretheshirtsmadeof第5课时习题课件新版人教新目标版2.ppt
- 社医-第五章.ppt
- 河北专版九年级英语全册Unit5Whataretheshirtsmadeof第6课时习题课件新版人教新目标版2.ppt
- 涉江采芙蓉-课件低版本.pptx
- 申肖克的救赎.pptx
- 河北专版九年级英语全册Unit6WhenwasitinventedSelfCheck习题课件新版人教新目标版2.ppt
- 深入C#的String类.ppt
- 河北省唐山市滦县2016_2017学年高二语文下学期期中试题2.doc
- 河北省大名县2017_2018学年高二政治上学期第一次月考试题2.doc
- 河北省大名县2017_2018学年高二地理上学期第一次月考试题2.doc
- 河北省大名县2017_2018学年高二物理上学期第一次月考试题2.doc
- 河北省大名县2017_2018学年高二数学上学期第一次月考试题2.doc
- 河北省大名县2017_2018学年高二生物上学期第一次月考试题2.doc
- 河北省大名县2017_2018学年高二英语上学期第一次月考试题2.doc
- 河北省大名县2017_2018学年高二语文上学期第一次月考试题2.doc
- 河北省大名县2018届高三化学上学期第一次月考试题普通班2.doc
- 河北省大名县2018届高三化学上学期第一次月考试题实验班2.doc
最近下载
- 电路板PCB工程师英文EQ整理.pdf VIP
- 2025年军事职业能力考核题库.pdf VIP
- 北师大版(2019)必修第一册 Life Choices Topic Talk 课件(共19张PPT).pptx VIP
- 园林苗圃的建立课件.ppt
- 商业智能原理、技术及应用教学课件10.ppt VIP
- 闽南语学习教程.pdf VIP
- 政治老师家长会发言课件.pptx
- 结构专业图集-01(04)SG519多、高层民用建筑钢结构节点构造详图(2004年局部修改版).pdf VIP
- NB_T 10731-2021CN 煤矿井下防水密闭墙设计施工及验收规范.docx
- F701B.D _12-07版本)仪表说明书1.pdf VIP
文档评论(0)