- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种基于k-prototype的多层次聚类改进算法-河海大学期刊部主办
第 卷第 期 河 海 大 学 学 报 (自然 科 学 版 )
*( * U0P + *( @0 + *
年 月 ( )
!) ( O0M/:P 0Q E0R:S 4ST3/=S12 @:1M/:P AFS3F3= K:2 !)
一种基于!#$%%’#( 的多层次聚类改进算法
李士进,朱跃龙,刘 净
(河海大学计算机及信息工程学院,江苏 南京 !%$’)
摘要:针对,-./01012.3 算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的
问题,提出一种基于,-./01012.3 的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高
的簇进行再聚类,以提高聚类质量 以 标准测试数据集进行实验,实验结果表明,该改进算法能
+ 456
够明显提高混合型数据集的聚类质量,并且在数据约简方面有良好表现+
关键词:聚类;混合数据;多层次聚类; 聚类
,-./01012.3
中图分类号: 文献标识码: 文章编号: ( )
78*%% 9 % %$’ !) * *! #
! ! !
[]
%
聚类分析是数据挖掘中一个非常活跃的研究分支,具有广泛的应用前景 聚类方法主要有以下几类 :
+
()划分方法,如 算法, 算法;()层次的方法,如 和 算法;()基于密度的方
: ,-;3:= 59?9@A B 54?C D6?5E F
法, 是其典型代表,另外还有 算法;()基于网格的方法, 是基于该方法的一个典型例
GDA59@ H8765A I A76@J
子;()基于模型的方法,如一些统计学和神经网络的方法
3 +
上述方法存在以下问题:()对于可处理的数据类型存在局限,许多算法只限于处理仅包括数值属性或
:
仅包括类别属性的数据集,对于适合于混合属性数据集的聚类算法却较少;()需要确定一些参数,并且这些
B
参数的设置和聚类的结果密切相关,特别是很多算法需预先给出聚类的簇数;()对数据分布的适应性,一些
文档评论(0)