最小生成树聚类方法研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最小生成树聚类方法研究毛韶阳1 ,2 ,(11 湖南人文科技学院 数学系 , 湖南 娄底李肯立2 最小生成树聚类方法研究 毛韶阳1 ,2 , (11 湖南人文科技学院 数学系 , 湖南 娄底 李肯立2 , 王志和1 21 湖南大学 计算机与通信学院 , 湖南 长沙 410082) 417000 ; 摘 要 : 由聚类所生成的簇是一组数据对象的集合 , 在同一个类中的对象之间具有较高的相似度 , 而不同类中 的对象差别较大 1 图的最小生成树具有最优子结构性质 , 删除最小生成树的最大边后的两颗子树依然分别是两个子 图的最小生成树 , 因此可由生成图的最小生成树获得聚类 1 此方法适用于所有欧氏空间数据的聚类 1 关键词 : 谱系图 ; 中图分类号 : TP274 EMST ; 普里姆算法 文献标识码 : A 文章编号 : 1671 - 9743 (2007) 05 - 0038 - 03 2 问题 ,除非 NP = P ,否则求解时间呈指数增长 1 笔者经 过探索 ,找到了一种由数据构造完全图 →寻找 MST →根 据要求寻找聚类的方法 ,并在 VC610 下编程实现 1 该算 法充分利用最小生成树的最优子结构特性 ,不必重复计 算已经生成的聚类的重心 1 2 相关概念及原理 211 谱系图( dendrogram) 和聚类谱系图 谱系图的根结点为一个包含全部成员的簇 ,谱系图 的叶结点为一个个包含单个成员的簇 1 谱系图的中间 结点表示由其子结点合并而成的新簇 1 聚类谱系图则 是在谱系图的基础上增加一些数据特征2 1 在下图 1 中 我们在树的每一层都用距离度量来合并相邻的下层簇 , 在某一层的所有的簇是并列的 ,因为该层某个簇的子簇 之间的距离要小于该簇的子簇的子簇与该层其它簇之 间的距离 1 1 引 言 数据挖掘是从大量数据中提取出可信、新颖 、有效 并能被人理解的模式的高级处理过程 1 其目标是从数 据库中发现隐含的 、有意义的知识 1 聚类分析作为一个 独立的工具来获得数据分布的情况 ,是数据挖掘的一个 重要研究分支 1 所谓聚类 ,就是将物理或抽象对象的集 合分组成为由类似的对象组成的多个类的过程 1 由聚 类所生成的簇是一组数据对象的集合 ,在同一个类中的 对象之间具有较高的相似度 ,而不同类中的对象差别较 大 1 迄今为止 , 人们已经提出了很多聚类算法 , 它们分 为如 下 几 类 : 划 分 方 法 ( partitioning method) 、层 次 方 法 ( hierarchical method) 、基 于 密 度 的 方 法 ( density - based method) 、基于网格的方法 ( grid - based method) 和基于模 型的方法 ( model - based method) 1 1 但是 ,上述这些算法复杂度较高 , 如划分方法的串 行时间复杂度一般为 O ( n2 ) ,它是一个经典的 NP 完全 图 1 谱系图显示分层聚类的过程 212 无向连通带权图的最小生成树(MST) 及其性质 设 G = ( V , E) 是无向连通带权图 , E 中每条边 ( v , w) 的权为 c [ v ] [ w ]1 如果 G 的子图 G 是一棵包 含 G 的所有顶点的树 ,则称 G 为 G 的生成树 1 生成树 上各边权的总和称为该生成树的耗费 1 在 G 的所有 生成树中 ,耗费最小的生成树称为 G 的最小生成树 1 收稿日期 : 2007 - 04 - 15 基金项目 : 国家自然科学基金项目 , , , ; 教育部重点项目 (05128) 1 作者简介 : 毛韶阳 (1972 - ) , 男 , 湖南娄底人 , 湖南人文科技学院讲师 , 硕士 , 主要研究数据挖掘 , 并行算法 ; 李肯立 (1971 - ) , 男 , 湖南涟源人 , 湖南大学副教授 , 博士 , 主要研究并行计算 、生物计算 1 两个问题 13 算法设计本算法分为三个步骤 : (1) 完全图的生成 ,邻接矩阵 的建立 ; (2) 最小生成树的查找 ; ( 3) 根据相关的聚类数 查找图的连通分量 1若图 G 两个问题 1 3 算法设计 本算法分为三个步骤 : (1) 完全图的生成 ,邻接矩阵 的建立 ; (2) 最小生成树的查找 ; ( 3) 根据相关的聚类数 查找图的连通分量 1 若图 G( V , E) 中每两个顶点之间恰有一条边 ,则称 G 为完全图 1 聚类分析时的数据

文档评论(0)

ligennv1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档