最小生成树聚类方法研究.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最小生成树聚类方法研究

第26卷第5期怀化学院学报Vol1261No152 0 0 7 年 5月J OURNAL OF HUAIHUAUNIVERSITYMay1 ,2007最小生成树聚类方法研究毛韶阳1 ,2 ,李肯立2 ,王志和1(11湖南人文科技学院数学系, 湖南娄底 417000;21 湖南大学 计算机与通信学院 , 湖南 长沙410082)摘要:由聚类所生成的簇是一组数据对象的集合,在同一个类中的对象之间具有较高的相似度,而不同类中 的对象差别较大1图的最小生成树具有最优子结构性质, 删除最小生成树的最大边后的两颗子树依然分别是两个子图的最小生成树, 因此可由生成图的最小生成树获得聚类1此方法适用于所有欧氏空间数据的聚类1关键词 : 谱系图;EMST;普里姆算法中图分类号 : TP274文献标识码 :A文章编号 : 1671 - 9743 (2007) 05 - 0038 -031引言问题,除非NP=P,否则求解时间呈指数增长[2]1笔者经数据挖掘是从大量数据中提取出可信、新颖、有效并能被人理解的模式的高级处理过程1其目标是从数据库中发现隐含的、有意义的知识1聚类分析作为一个 独立的工具来获得数据分布的情况,是数据挖掘的一个 重要研究分支1 所谓聚类,就是将物理或抽象对象的集合分组成为由类似的对象组成的多个类的过程1由聚类所生成的簇是一组数据对象的集合,在同一个类中的 对象之间具有较高的相似度,而不同类中的对象差别较 大1迄今为止,人们已经提出了很多聚类算法,它们分为如下几类:划分方法(partitioning method)、层次方法(hierarchicalmethod)、基于密度的方法(density-basedmethod) 、基于网格的方法 ( grid - based method)和基于模 型的方法(model - based method) [ 1 ]1但是,上述这些算法复杂度较高,如划分方法的串行时间复杂度一般为O(n2) ,它是一个经典的NP完全过探索,找到了一种由数据构造完全图→寻找MST →根据要求寻找聚类的方法,并在VC610下编程实现1该算 法充分利用最小生成树的最优子结构特性,不必重复计算已经生成的聚类的重心12 相关概念及原理211谱系图( dendrogram)和聚类谱系图 谱系图的根结点为一个包含全部成员的簇,谱系图的叶结点为一个个包含单个成员的簇1谱系图的中间结点表示由其子结点合并而成的新簇1聚类谱系图则是在谱系图的基础上增加一些数据特征[2]1在下图1中 我们在树的每一层都用距离度量来合并相邻的下层簇,在某一层的所有的簇是并列的,因为该层某个簇的子簇之间的距离要小于该簇的子簇的子簇与该层其它簇之间的距离1图 1 谱系图显示分层聚类的过程212无向连通带权图的最小生成树(MST)及其性质设 G = ( V , E) 是无向连通带权图 , E中每条边(v,w)的权为c[v][w]1如果G的子图G′是一棵包含G的所有顶点的树,则称G′为G的生成树1生成树上各边权的总和称为该生成树的耗费1在G 的所有 生成树中,耗费最小的生成树称为G的最小生成树1收稿日期 : 2007 - 04 -15基金项目 : 国家自然科学基金项目 , , , ; 教育部重点项目 (05128) 1作者简介: 毛韶阳(1972-), 男, 湖南娄底人, 湖南人文科技学院讲师,硕士, 主要研究数据挖掘, 并行算法;李肯立(1971-), 男, 湖南涟源人, 湖南大学副教授,博士, 主要研究并行计算、生物计算1第26卷第5期毛韶阳,李肯立,王志和:最小生成树聚类方法研究·39 ·21211 MST 的性质:最小生成树性质 :设 G = ( V , E)是一个连通网 络,U是顶点集V的一个真子集1若(u,v)是G中所 有的一个端点在U(u∈U) 里、另一个端点不在U (即 v ∈V - U) 里的边中 ,具有最小权值的一条边, 则一定存在G的一棵最小生成树包括此边( u, v)[3,8,9]121212欧几里德最小生成树(EMST)最优子结构性 质:设 T 是图 G( V , E) 的一棵 EMST , ( u , v) 是 T中 最大边 ,去除该边后生成两个连通支 T1 和 T2 ,则T1一定是子图 G1 (含连通支 T1 的所有顶点) 的EMST1证明 :不妨设子图 G1 的最小生成树是T1′而并非 T1,其中∑ω[i][ j] ∑ω[i][ j],两个问题13算法设计本算法分为三个步骤:(1)完全图的生成,邻接矩阵 的建立;(2)最小生成树的查找;(3)根据相关的聚类数

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档