- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于层次的模糊K均值聚类算法研究1里面前4个是2-5
安阳师范学院学报 47
基于层次的模糊 K均值聚类算法研究
苏 瑞
(广东商学院 经济与管理实验教学中心,广东 广州 510320)
[摘 要]通过对K均值聚类算法的研究,本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法
首先使用层次方法对数据进行初始聚类 ,然后用得到的聚类数作为模糊 K均值聚类中的K值 ,对聚类进行修正。最后
通过实验,验证了该算法不需要人为假设聚类算法巾的K值,而且引入 了模糊隶属关系使类别的划分更接近于事实 ,从
而证明了该算法的有效性。
[关键词]层次;模糊 ;聚类;K一均值算法
[中图分类号]Tit393.02 [文献标识码]A [文章编号]1671—5330(2010)02—0047—40
O 引言
1 K一均值聚类
聚类是数据分析中的一项重要技术 ,是众多
科学领域和工程技术 中的一项基础性工作 。聚类 K—MEANS算法作为运用最多的一种传统的
分析被广泛应用于生物学、天体物理学、模式识 聚簇方法,其工作流程如下:首先,随机地选择 K
别、决策支持、数据挖掘、图像处理、最优化 问题 个对象,每个对象初始地代表 了一个簇 的平均值
等。所谓聚类是把 d维特征空间中的 Ⅳ个数据 点 或中心。对剩余的每个对象,根据其与各个簇 中心
分成 个不同的类,使类内数据点的相似度高、不 的距离,将其赋给最近的簇。然后重新计算每个簇
同类之问的数据点的相似度低H。j。这里的相似 的平均值,求出新的簇中心,再重新聚簇 。这个过
在特征空间中表现为距离近 ,所以距离可 以用来 程不断重复,直到准则函数收敛。该算法运行效率
对 2个数据点进行相似性测度。目前 已提 出的聚 较高,但缺点在于只能处理数值型数据、不能处理
类算法有很多,这些算法可以被分为基于划分方 分类数据 ,对例外数据非常敏感 ,不能处理非凸面
法 、基于层次方法 、基于密度方法 、基于 网格方法 形状的聚簇 。如果选取的初始聚类 中心不合适,
和基于模型方法。 将不仅影响收敛速度 ,还有可能使算法陷入局部
K一均值聚类是在各个领域用得最多的聚类 最优 。K一均值聚类就是 目前广泛应用的C均值
算法之一。它的主要特点是:对给定的数据集可能 聚类 ,其 核 心 思 想 是 :将 凡个 向量 (X ,
存在 的类数 目需要作出假设 ;对用来代表某类的 2… … )分成 C个组(G ,G ,…G,…G。),并求
类中心需要在迭代计算前做初始化;迭代计算出 每组的聚类 中t2,C,使得距离指标的价值函数达
的类 中心容易陷入某些满足局部最优 的值 中。可 到最小。选用欧几里德距离作为组 i中向量 瓦 与
以看 出,设定恰 当的类数 目和初始化合适 的类 中 相应聚类中心 C之间的非相似性指标 ,价值 函数
心是K一均值聚类算法中的关键 。本文通过在
定义为:J=∑ ∑ lI 一clI。这样,组内的价
K一均值聚类的基础上引人层次聚类来设定恰当 =1k.xk∈Gi
的聚类数 目、通过引入模糊 “隶属”关系,使每一 值函数 的值依赖于组 的几何特性和类 中心位置 。
个样本点以一定的概率属于某一类别 、并且可 以 划分后 的组一般通过一个 C Ⅳ的二维隶属矩阵
通过隶属度这个 自由参数来控制不 同类别的混合 来定义。如果第 个数据点 ,属于组 i,则 中的
程度 。
原创力文档


文档评论(0)