自适应的k-means聚类算法SA-K-means.pdfVIP

下载本文档

50
0
约1.74万字
约 3页
2017-09-01 发布于湖北
举报
版权申诉

自适应的k-means聚类算法SA-K-means.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

自适应的k-means聚类算法SA-K-means.pdf

ii2l圜丁。。。。．。。。。，技术创新自适应的k-means聚类算法SA-K-means 周慧芳 (1．江南大学信息学院江苏无锡 214122；2．盐城师范学院图书馆江苏盐城 224002) 摘要：传统的k--means聚类算法对初始聚类中心非常敏感，聚类的结果也常常随着初始聚类中心而波动为了降低聚类算法的这种敏感性，本文提出了一种自适应的聚类算法(sA—K—means)，该方法通过计算数据对象区域的密度，选择相互距离最远的高密度区域的中心作为初始聚类中心。实验表明sA—K—means聚类算法能有效地消除聚类算法对初始聚类中心的敏感性，得到满意的聚类结果。关键词：聚类 k--means 聚类中心中图分类号：TP319 文献标识码：A 文章编号：1674--098X(2009)12(a)一0004-03 1前言标函数形式为平方误差准则函数 k—means算法中常采用误差平方和准聚类是指将许多不同类别的数据对象则函数作为聚类准则函数，考察误差平方进行划分，分组成为多个类或者簇的方法。 E ∑：，∑，Ip· (2-1) 和准则函数发现：如果各类之间区别明显数据聚类总是使同一类或者簇内的数据对且数据分布稠密，则误差平方和准则函数象尽可能的相似，而不是同类或者簇内的式(2-1)中，E是所有对象的平方误差的比较有效；但是如果各类的形状和大小差数据对象尽可能的相异”】。通过聚类可以识总和，尸是数据对象，表示给定的数据对象，别很大，为使误差平方和的值达到最小，有别密集和稀疏的区域，从而发现全局的分 ki是簇 Ci的重心(册 1,／都是多维的)。这个可能出现将大的聚类分割的现象。此外，在布模式，以及数据属性之间的相互关系。下准则能找出令平方误差函数值最小的B／个运用误差平方和准则函数度量聚类效果面，我们先给出簇的定义：划分，使得生成的结果簇尽可能地紧凑和时，最佳聚类结果对应于目标函数的极值定义1给定数据集V{vl，，…，}，其独立。点，由于目标函数存在着许多局部极小点，中 =1，_2，．．．，叫做数据点。基于数据点 k-means聚类算法的过程描述如下：而算法的每一步都是沿着目标函数减小的间的相似性而划分V为 {，…． }， (1)随机选取丘个数据对象作为初始簇方向进行，若初始化落在了一个局部极小 cf f=1，2，．．．，，且u =V的过程的重心；点附近，就会造成算法在局部极小点收敛。叫做聚类。叫做簇。 (2)计算数据对象与各个簇的重心的距聚类分析作为一个独立的工具能使我离，将对象分配到距离其最近的重心所代 3k-means算法的现有改进们获得数据的分布情况，观察每个簇的特表的簇；根据k-means算法的缺点，许多研究者点，并且对特定的某些簇做进一步的分析。 (3)重新计算各个簇的数据对象的平均提出了k—means算法的变体。这些变体可能对于聚类分析，国内外的学者已经广泛地值，即重心；在初始簇的选择、相异度的计算和计算聚研究了许多年，并且也提出了许多聚类的 (4)若每个簇的重心都不再变化，或者类重心的策略上有所不同。目前，对k— 算法，常用的有k-means算法，CLIQUE算指定的收敛准