基于层次的模糊K均值聚类算法研究1里面前4个是2-5.pdfVIP

下载本文档

1
0
约9.27千字
约 4页
2017-12-08 发布于浙江
举报
版权申诉

基于层次的模糊K均值聚类算法研究1里面前4个是2-5.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于层次的模糊K均值聚类算法研究1里面前4个是2-5

安阳师范学院学报 47 基于层次的模糊 K均值聚类算法研究苏瑞 (广东商学院经济与管理实验教学中心，广东广州 510320) [摘要]通过对K均值聚类算法的研究，本文提出了一种基于层次聚类与模糊聚类思想的K均值聚类算法。算法首先使用层次方法对数据进行初始聚类，然后用得到的聚类数作为模糊 K均值聚类中的K值，对聚类进行修正。最后通过实验，验证了该算法不需要人为假设聚类算法巾的K值，而且引入了模糊隶属关系使类别的划分更接近于事实，从而证明了该算法的有效性。 [关键词]层次；模糊；聚类；K一均值算法 [中图分类号]Tit393．02 [文献标识码]A [文章编号]1671—5330(2010)02—0047—40 O 引言 1 K一均值聚类聚类是数据分析中的一项重要技术，是众多科学领域和工程技术中的一项基础性工作。聚类 K—MEANS算法作为运用最多的一种传统的分析被广泛应用于生物学、天体物理学、模式识聚簇方法，其工作流程如下：首先，随机地选择 K 别、决策支持、数据挖掘、图像处理、最优化问题个对象，每个对象初始地代表了一个簇的平均值等。所谓聚类是把 d维特征空间中的 Ⅳ个数据点或中心。对剩余的每个对象，根据其与各个簇中心分成个不同的类，使类内数据点的相似度高、不的距离，将其赋给最近的簇。然后重新计算每个簇同类之问的数据点的相似度低H。j。这里的相似的平均值，求出新的簇中心，再重新聚簇。这个过在特征空间中表现为距离近，所以距离可以用来程不断重复，直到准则函数收敛。该算法运行效率对 2个数据点进行相似性测度。目前已提出的聚较高，但缺点在于只能处理数值型数据、不能处理类算法有很多，这些算法可以被分为基于划分方分类数据，对例外数据非常敏感，不能处理非凸面法、基于层次方法、基于密度方法、基于网格方法形状的聚簇。如果选取的初始聚类中心不合适，和基于模型方法。将不仅影响收敛速度，还有可能使算法陷入局部 K一均值聚类是在各个领域用得最多的聚类最优。K一均值聚类就是目前广泛应用的C均值算法之一。它的主要特点是：对给定的数据集可能聚类，其核心思想是：将凡个向量 (X ，存在的类数目需要作出假设；对用来代表某类的 2… … )分成 C个组(G ，G ，…G，…G。)，并求类中心需要在迭代计算前做初始化；迭代计算出每组的聚类中t2,C，使得距离指标的价值函数达的类中心容易陷入某些满足局部最优的值中。可到最小。选用欧几里德距离作为组 i中向量瓦与以看出，设定恰当的类数目和初始化合适的类中相应聚类中心 C之间的非相似性指标，价值函数心是K一均值聚类算法中的关键。本文通过在定义为：J=∑ ∑ lI 一clI。这样，组内的价 K一均值聚类的基础上引人层次聚类来设定恰当 =1k．xk∈Gi 的聚类数目、通过引入模糊 “隶属”关系，使每一值函数的值依赖于组的几何特性和类中心位置。个样本点以一定的概率属于某一类别、并且可以划分后的组一般通过一个 C Ⅳ的二维隶属矩阵通过隶属度这个自由参数来控制不同类别的混合来定义。如果第个数据点，属于组 i，则中的程度。