对k均值算法和硬C-均值算法的对比分析.pdfVIP

对k均值算法和硬C-均值算法的对比分析.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对k均值算法和硬C-均值算法的对比分析

第22卷第l期 洛阳理工学院学报(自然科学版) VOI.22No.1 2012,3月 Journalof InstituteofScienceand Science Mar.2012 Luoyang Technology心aturalEdition) 对k均值算法和硬C_均值算法的对比分析 李宇泊,李秦 (兰州交通大学数理与软件工程学院,甘肃兰州730070) 摘要:通过比较目标函数、聚类原型模AJ,(0)的初始化方法、划分矩阵d和聚类原型P的更新方法等4个方面,得 出露均值算法和硬c-均值算法的区另q. 关键词:盂均值算法;硬(均值算法:硬划分 DOI:10.3969/j.issn.1674-5043.2012.01.017 中图分类号:017文献标志码:A 文章编号:1674—5043(2012)01.0072-04 聚类把一个没有类别标记的样本集按某种准则划分成若干个子集,使相似的样本尽可能归为一类, 而不相似的样本尽量划分到不同的类中”‘。传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地 划分到某类中,具有非此即彼的性质,这种类别划分的界限是分明的。硬划分的聚类分析可用如下的数 学模型描述。 X={XI 量。硬划分就是分析论域Ⅸ中的刀个样本所对应的模式矢量间的相似性,按照各样本间的亲疏关系把 zl,x 4 p囔∈Eh 二jL E={∥膻∈{o,1);∑纨=1,Vk;O∑心刀,Vi) (1) i=1 k=l 即要求每一个样本能且只能隶属于某一子集,同时要求每个子集都是非空的。 聚类源于许多研究领域,包括数据挖掘、统计学、生物学和机器学习。所以聚类的研究具有交叉特 性,于是各种不同的聚类算法不断出现。这些聚类算法有不同的分类方法,通常将聚类算法大致分成层次 方法、划分方法、基于密度的方法、基于网格的方法和基于模型的方法”。。聚类算法的分类如图l所示。 为了借助目标函数法求解聚类问题,人们利用均方逼近理论构造了带约束的非线性规划函数,从此 Sum 类内平方误差和0NGSS。Within-GroupsofSquaredError)JI成为聚类目标函数的普遍形式。硬c-均 1980年Bezdek”1证明了模糊c-均值(FCM)聚类算法与硬c-均值聚类算法的关系。 B k均值算法具有很长的历史,最早的k均值算法由J 发展,k均值算法已经衍生出多种变形算法,组成了k均值算法家族。露均值算法属于动态聚类方法,动态 聚类的特点是要求确定某个评价聚类结果质量的准则函数,并给定某个初始分类,然后用迭代算法找出 收稿日期:2012-01-05 作者简介:搠(1982-),女,甘肃庆阳人雇读硕士研究生,主要从事聚类分析方面的研究. 万方数据 第1期 李宇泊等:对J|I均值算法和硬c-均值算法的对比分析 使准则函数取极值的最好聚类结果。露均值算法以距离平方和最小作为准则函数,故又称“距离平方和极 小化聚类法”。 图1聚类算法的分类 硬c-均值算法和露均值算法都属于硬划分,在一些文献中认为硬C-均值算法和眉均值算法是同一个算 法m1,而一些文献提出硬c-均值算法和七均值算法并非同一个算法的观点例。本文将从目标函数、聚类原 型模式只0)的初始化方法、划分矩阵帅聚类原型P的更新方法等4个方面对两个算法作对比分析。 2硬c-均值算法和k均值算法 2.1硬C.均值算法的基本思想 欲将样本集合X={■,x2,…,吒分为c类,使x中任意样本船完全属于某一类,且每一类至少包含一 个样本。即 X X

文档评论(0)

xxj1658888 + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2024年04月12日上传了教师资格证

1亿VIP精品文档

相关文档