基于K-means的最佳聚类数确定方法研究.pdf

基于K-means的最佳聚类数确定方法研究.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于K-means的最佳聚类数确定方法研究.pdf

ISSN1009-3044 E-mail:eduf@ ComputerKnowledgeandTechnology电脑知识与技术 第10卷第1期 (2014年1月) ComputerKnowledgeandTechnology 电脑知识与技术 Vol.10,No.1,January2014 Tel:+86-55165690964 基于K-means的最佳聚类数确定方法研究 李红岩 ,胡林林 ,王江波 ,周红芳1 1 1 2 (1.许继电源有限公司,河南许昌416000;2.西安理工大学计算机科学与工程学院,陕西西安710048) 摘要:确定数据集的最佳聚类数是聚类研究中的一个重要难题。为了更有效地确定数据集的最佳聚类数,该文提出了通 过改进K-means算法并结合一个不依赖于具体算法的有效性指标Q(c)对数据集的最佳聚类数进行确定的方法。理论分 析和实验结果证明了该方法具有良好的性能和有效性。 关键词:K-means;最佳聚类数;聚类有效性指标;聚类 中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)01-0110-05 AMethodforDeterminingVintageNumberofClustersBasedonK-meansAlgorithm LIHong-yan1,HUlin-lin,WANGJiang-bo,ZHOUHong-fang1 1 2 (1.XUJIGroupCorporationofNationalGridofChina,Xuchang416000,China;2.SchoolofComputerScienceandEngineer⁃ ing,Xi’anUniversityofTechnology,Xi’an710048,China) Abstract:Determiningtheoptimalnumberofclustersinadatasetisadifficultproblemintherelativeresearchfieldofcluster.To resolvethisproblemeffectively,amethodforgettingtheoptimalclusternumberinamassivedatasetisproposedbasedonK- meansalgorithmandclusterqualityvalidityindex Q(c).Theoreticalanalysisandexperimentalresultshaveverifiedtheeffective⁃ nessandgoodperformanceofthealgorithm. Keywords: K-means;optimalnumberofclusters;clusteringvalidityindex;clustering [1] 传统的获取最佳聚类数的算法一般是采用的是基于一种迭代的trial-and-error过程 ,来获取数据集的最佳聚类数目。由于 k-means算法适用于大型数据集的处理,且其效率比较高,特别是当数据集中的数据对象分布呈现类内团聚状时,所得到的聚类结 果往往是比较好的。在实际中,由于用户缺乏丰富聚类分析的经验,所以能够准确地确定数据集的聚类数k的值是一个非常困难 的问题[2],这样就大大限制的该算法应用,而且确定的k值也往往不能保证是合适的,就需要结合一些有效性指标来确定其最佳聚 类数,目前已经提出了一些检验聚类有效性的指标,主要代表有 [3] [1] V 指标 、V 指标 等。由于这些指标都是基于其他算法提出的,

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档