- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最小生成树聚类方法研究毛韶阳1 ,2 ,(11 湖南人文科技学院 数学系 , 湖南 娄底李肯立2
最小生成树聚类方法研究
毛韶阳1 ,2 ,
(11 湖南人文科技学院 数学系 , 湖南 娄底
李肯立2 ,
王志和1
21 湖南大学 计算机与通信学院 , 湖南 长沙 410082)
417000 ;
摘 要 : 由聚类所生成的簇是一组数据对象的集合 , 在同一个类中的对象之间具有较高的相似度 , 而不同类中
的对象差别较大 1 图的最小生成树具有最优子结构性质 , 删除最小生成树的最大边后的两颗子树依然分别是两个子 图的最小生成树 , 因此可由生成图的最小生成树获得聚类 1 此方法适用于所有欧氏空间数据的聚类 1
关键词 : 谱系图 ;
中图分类号 : TP274
EMST ;
普里姆算法
文献标识码 : A
文章编号 : 1671 - 9743 (2007) 05 - 0038 - 03
2
问题 ,除非 NP = P ,否则求解时间呈指数增长 1 笔者经
过探索 ,找到了一种由数据构造完全图 →寻找 MST →根
据要求寻找聚类的方法 ,并在 VC610 下编程实现 1 该算
法充分利用最小生成树的最优子结构特性 ,不必重复计
算已经生成的聚类的重心 1
2 相关概念及原理
211 谱系图( dendrogram) 和聚类谱系图 谱系图的根结点为一个包含全部成员的簇 ,谱系图
的叶结点为一个个包含单个成员的簇 1 谱系图的中间
结点表示由其子结点合并而成的新簇 1 聚类谱系图则
是在谱系图的基础上增加一些数据特征2 1 在下图 1 中 我们在树的每一层都用距离度量来合并相邻的下层簇 , 在某一层的所有的簇是并列的 ,因为该层某个簇的子簇 之间的距离要小于该簇的子簇的子簇与该层其它簇之 间的距离 1
1 引
言
数据挖掘是从大量数据中提取出可信、新颖 、有效
并能被人理解的模式的高级处理过程 1 其目标是从数
据库中发现隐含的 、有意义的知识 1 聚类分析作为一个
独立的工具来获得数据分布的情况 ,是数据挖掘的一个
重要研究分支 1 所谓聚类 ,就是将物理或抽象对象的集
合分组成为由类似的对象组成的多个类的过程 1 由聚
类所生成的簇是一组数据对象的集合 ,在同一个类中的
对象之间具有较高的相似度 ,而不同类中的对象差别较
大 1 迄今为止 , 人们已经提出了很多聚类算法 , 它们分
为如 下 几 类 : 划 分 方 法 ( partitioning method) 、层 次 方 法
( hierarchical method) 、基 于 密 度 的 方 法 ( density - based
method) 、基于网格的方法 ( grid - based method) 和基于模
型的方法 ( model - based method) 1 1
但是 ,上述这些算法复杂度较高 , 如划分方法的串
行时间复杂度一般为 O ( n2 ) ,它是一个经典的 NP 完全
图 1 谱系图显示分层聚类的过程
212 无向连通带权图的最小生成树(MST) 及其性质
设 G = ( V , E) 是无向连通带权图 , E 中每条边
( v , w) 的权为 c [ v ] [ w ]1 如果 G 的子图 G 是一棵包
含 G 的所有顶点的树 ,则称 G 为 G 的生成树 1 生成树
上各边权的总和称为该生成树的耗费 1 在 G 的所有
生成树中 ,耗费最小的生成树称为 G 的最小生成树 1
收稿日期 : 2007 - 04 - 15
基金项目 : 国家自然科学基金项目 , , , ; 教育部重点项目 (05128) 1
作者简介 : 毛韶阳 (1972 - ) , 男 , 湖南娄底人 , 湖南人文科技学院讲师 , 硕士 , 主要研究数据挖掘 , 并行算法 ;
李肯立 (1971 - ) , 男 , 湖南涟源人 , 湖南大学副教授 , 博士 , 主要研究并行计算 、生物计算 1
两个问题 13 算法设计本算法分为三个步骤 : (1) 完全图的生成 ,邻接矩阵 的建立 ; (2) 最小生成树的查找 ; ( 3) 根据相关的聚类数 查找图的连通分量 1若图 G
两个问题 1
3 算法设计
本算法分为三个步骤 : (1) 完全图的生成 ,邻接矩阵 的建立 ; (2) 最小生成树的查找 ; ( 3) 根据相关的聚类数 查找图的连通分量 1
若图 G( V , E) 中每两个顶点之间恰有一条边 ,则称 G 为完全图 1 聚类分析时的数据
您可能关注的文档
最近下载
- 养老院门卫管理制度.pdf VIP
- 电力设施保护条例实施细则.pdf VIP
- 统编语文三年级上册第七单元《口语交际:身边的“小事” 》.pptx VIP
- 2024年中央纪委国家监委驻中国邮政集团有限公司招聘笔试参考题库附带答案详解.pdf VIP
- 《大学生创新创业基础》 第六章 市场调查与营销策略.pptx
- 建筑防水工程施工质量监理实施细则hg.doc VIP
- 环境材料概论 课件全套 第1--9章 绪论、吸附材料 ---环境材料的绿色设计.pptx
- 中职英语英语教学计划.docx VIP
- HGT2226-2019普通工业沉淀碳酸钙.pdf VIP
- 3肖仰华-大规模知识图谱构建与应用.pdf VIP
文档评论(0)