- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
系统发生网络构建算法总结
系统发生网络构建算法总结
摘要:物种的进化史通常被描述成一棵有根系统树,但是当物种进化过程中发生网状进化事件(如,杂交、重组和水平基因转移)时,物种的进化史不再适合被描述成系统树。系统发生网络是系统树的一般化,也是被用来描述物种的进化史,并可以描述物种的网状进化事件。而且系统发生网络也可以可视化冲突数据集,如由不同的基因得到的物种树。因此,系统发生网络的研究是生物信息的一个重要领域。介绍了系统发生网络的概念、发展、研究现状,总结了现有的系统发生网络构建算法。
关键词:系统发生网络; 网状进化事件; 隐式网络; 显式网络
中图分类号:TP301 文献标识码:A文章编号:2095-2163(2014)01-0032-04
0引言
通常用系统树来表示一组分类单元的进化关系,这一模式有利于假设的讨论和检验。然而当描述更复杂的进化关系时,系统树的功能则略显不足。随着研究的逐渐深入,科学家们发现有些物种在进化过程中发生了网状进化事件,如反转(reversal)、移位(translocation)和转位(transposition)、重组(recombination)、水平基因转移(horizontal gene transfer,HGT)、杂交(hybridization)、基因转移或者基因重复和丢失[1-6]等,则此时生物的父代即不止一个,系统树不能描述各代之间的进化关系,因此促动了系统发生网络(phylogenetic network)的出现。系统发生网络构建方法及理论分析的研究是计算生物学的一个重要方向。系统发生网络是系统树的一般形式,又可译作系统演化网络、系统进化网络、进化网络。该种网络更适合那些发生了网状进化事件的数据,而且,对于树式进化模式(碱基的替代、插入、删除等)进化而来的数据,系统发生网络也可以实现数据中冲突信息的清晰表达,如由于不完全谱系分类机制或者是由于进化模型假设的不足引起的冲突信息[7]。系统发生网络是一个无环图,图中有些节点的父节点个数 ≥ 2(这种节点也被称为网络节点),如果图中没有网络节点,那么这时的系统发生网络就是一棵树。
系统发生网络根据拓扑结构分为无根(unrooted)网络和有根(rooted)网络;根据功能分为隐式(implicit)和显式(explicit)网络[8]。隐式网络(例如分割网络和准中位数网络)则可用来表示冲突信息,这些冲突信息可能来自各种原因,如模型误设(model misspecifi cation);而显式网络则是尽力捕获生物进化过程中的网络进化事件,如杂交(hybridization)[9-10]、重组(recombination)[11-15]及水平基因转移(horizontal gene transfer, 简称HGT)[7,16-18]。显式网络中的内部节点表示祖先物种,且其中的网络节点对应所考虑的生物进化过程[14-16],而隐式网络中网络节点没有任何生物解释。显式网络通常是有根的,因为生物进化过程本质上是有向的。然而有根系统发生网络可能是隐式网络,这取决于对相应网络进行构建和解释的具体方式[8]。
1无根系统发生网络构建算法
无根系统发生网络是无根树的一般化。无根系统发生网络都是隐式网络,主要包括两类:分割网络(Split network)和准中位数网络(Quasi-median network)。在无根系统发生网络方面,分割(Split)的概念起了重要作用。下面将详细给出分割的定义。
定义1设X是一物种集合,A和B是X的非空子集,且A∩B=和A∪B=X,则S=A|B称为X的一个分割。
有时将分割A|B记为AB或者BA。分割S的大小记为size(S)=min{|A|,|B|}。大小为1的分割称为是平凡的(trivial)分割,否则称为非平凡的(non-trivial)分割。设T是X上的一棵无根系统树,那么T上的每一边定义了X的一个分割。
分割网络可以从很多不同的数据集(如距离矩阵、无根系统树集、序列及四分体)构建得到。从这些数据构建分割网络时,大部分算法都是首先计算出一个加权分割集(这里的权重可能表示的是距离或者特征变化量等),然后再由此加权分割集得到分割网络。由加权的分割集构建分割网络主要有两种方法:凸包算法(convex hull)[19]和圆形网络算法(circular network)[20]。对于任何一分割集,凸包算法都能为S构建一个无根系统发生网络,且最坏情况是此网络包含指数级的节点数和边数。而圆形网络算法构建的网络仅包含平方级的节点数和边数。
从距离矩阵得到加权分割集的方法主要有Neighbor-Net方法[21]和分割分解方法[22]。从无根系统树构建加权分割集的主要方法有一致
您可能关注的文档
最近下载
- 【英国皇家建筑师协会(RIBA)】2024年人工智能在建筑实践中的应用研究报告-RIBA AI Report 2024.docx VIP
- 2025年NSCA-CPT-II高级国际注册体能训练师考试备考题库及答案解析.docx VIP
- 2025年NSCA-CPT国际注册体能训练师考试备考题库及答案解析.docx VIP
- 三级进度计划.docx VIP
- 路基路面课程设计--路基与路面工程.doc VIP
- 中华武术智慧树知到期末考试答案章节答案2024年宁波大学.docx VIP
- 2025危险化学品企业安全生产标准化通用规范.pdf VIP
- 铃儿响叮当(Jingle Bells)钢琴谱五线谱 完整版原版.pdf
- 高考语文阅读理解《千里江山图》含答案.docx VIP
- 媒体文阅读专项-【中职专用】2024年中职高考语文二轮复习专项突破(四川适用)解析版.docx VIP
原创力文档


文档评论(0)