网站大量收购独家精品文档,联系QQ:2885784924

分支分类的树聚类法.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分支分类的树聚类法

维普资讯 l2卷 第2期 数理统计与应用概率 v0l12.No2 1997年6月 MathematicalStatisticsandAppIiedProbability June l997 一 1 分支分类的树聚类法 郑更新 . (中央民族 军扭学系.北京.1000~1) 摘 要 在分析分支分类的聚类特征和建立基集的最小导出树等概念的基础上,本文给 出一个分支分类方法.树聚类法。该方法包含聚台与调整两十过程.每个过程依赖于隶最小导 出树。实验结果表明该方法是正确的,井可由微机实现 ~Ui-3=竺圭坌聚类,最小导出树,!!耋 数量籍 生拎 辱 数量分类学(含表征分类和分支分类)是将数学方法和计算机技术应用于生物分类的 新兴边缘学科。在数量分类学中,被分类的对象称为运算分类单位.简记为OTU,金体 OTU构成的集合称为被分类群.以O表示,它为有限集。分类的依据是性状,性状是比 较一个OTU异同于其它OTU的性质、特征或属性。分支分类是根据生物演化关系对被 分类群分类,自8o年代后取得一系列成果,得到广泛应用. 在建立四个基本公理的基础上.【l】以演化集台作为分支分类问题的数学模型.根据 公理1,分支分类问题可归结为求一个包含0的共祖演化臬.该集合可由相应的赋权有 向图T(分支谱系图)表示.T的根日为祖源.T中的父结点与子结点体现了祖先与后裔 的演化关系.因而T为分支分类问题的解。据公理2,第J个性状的性状状态集合与一个 有冰序的整数集台{0,1.2,…,m,}同构,其中零对应于最原始性状状态,m,对应于最高 性状状态.编码数值体现了性状的演化方向.这样.第 i个OTU可表示为向量 = {H.i2,….i—i,i=1.2,…,t . 其中n为状态数.t为O中元素个数.因此。分支分类闻题可表示为聚类问题.实际上,聚 类方法已成为重要的分支分类运算方法,如Wagner网络法2【】,单元法nJ,最大同步法和 最小平行进化法….这些方法类似于Wishart系统聚类法l.但一般而亩,系统聚类法在 聚类过程中每次并类后得到的类不再改变,因而上述方法难以保证得到最优解。 为弥补以上方法的不足.我们曾根据随机优化理论提出过两种划分型聚类方法_,’, 本文将再给出一种分支分类运算方法.树聚类法. *收请甘j弭:95年 1月12日,收到修改稿 日期 ;96年6.耳1713 维普资讯 数理统计与应用概率 第 l2卷第2期 2 分支分类的聚类特征 本文所用的方法属于典型的系统聚类,即聚类过程中产生的类具有排列在一定次序 上的隶属关系。满足这一要求的方法是:在聚类时以一个类中所有点的祖先,而不是通常 所有的均值,作为该类的凝聚点.在分支谱系图T中.该点体现为包含该类各点的最小子 树的根;两上类z. (以凝聚点表示)的合并过程为求它们的父结点z.可用过算 “^”实 现,即 l ^ =Xf=(f1, 2.一· ) 其中z =rain1zi,z 1.J=1.2,…,n.进一步地.由于 “^”满足交换律和结合律,任意的 分支谱系图有相同的根 口=^ ,. 为满足公理 3(距离可加性).可定义点间.即类间的距离为: ,, 、 』a(xk)一口().当x0≤xkj.J:1,2,….n时. 毛 1+ . 其它,

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档