- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                自适应的k-means聚类算法SA-K-means.pdf
                    
         ii2l圜     丁。。。。.。。。。, 
                                                                       技 术 创 新 
           自适应的k-means聚类算法SA-K-means 
                                     周慧芳 
             (1.江南大学信息学院  江苏无锡  214122;2.盐城师范学院图书馆  江苏盐城  224002) 
   摘 要:传统的k--means聚类算法对初始聚类中心非常敏感,聚类的结果也常常随着初始聚类中心而波动 为了降低聚类算法的这种敏感 
   性,本文提 出了一种 自适应的聚类算法(sA—K—means),该方法通过计算数据对象区域的密度 ,选择相互距离最远的高密度区域的中心作 
   为初始聚类中心。实验表明sA—K—means聚类算法能有效地消除聚类算法对初始聚类中心的敏感性 ,得到满意的聚类结果。 
   关键词:聚类 k--means 聚类中心 
   中图分类号 :TP319       文献标识码 :A          文章编号 :1674--098X(2009)12(a)一0004-03 
1前言                         标函数形式为平方误差准则函数               k—means算法中常采用误差平方和准 
   聚类是指将许多不同类别的数据对象                                    则函数作为聚类准则函数 ,考察误差平方 
进行划分,分组成为多个类或者簇的方法。             E ∑:,∑,Ip·        (2-1) 和准则 函数发现 :如果各类之间区别明显 
数据聚类总是使同一类或者簇 内的数据对                                    且数据分布稠密 ,则误差平方和准则 函数 
象尽可能的相似 ,而不是 同类或者簇 内的         式(2-1)中,E是所有对象的平方误差的     比较 有效 ;但是如果 各类的形状和大 小差 
数据对 象尽可能的相异”】。通过聚类可以识  总和 ,尸是数据对象,表示给定的数据对象, 别很大 ,为使误差平方和的值达到最小 ,有 
别密集和稀疏 的区域 ,从而发现全局的分        ki是簇 Ci的重心(册 1,/都是多维的)。这个  可能出现将大的聚类分割 的现象 。此外 ,在 
布模式,以及数据属性之间的相互关系。下  准则能找 出令平方误差函数值最小的B/个  运用误差平方和准则 函数度量聚类效果 
面 ,我们先给 出簇 的定义 :            划分 ,使得生成的结果簇尽可能地紧凑和        时,最佳聚类结果对应于 目标函数的极值 
   定义1给定数据集V{vl,,…,},其 独立 。                            点,由于 目标函数存在着许多局部极小点, 
中  =1,_2,..., 叫做数据点。基于数据点     k-means聚类算法的过程描述如下:      而算法的每一步都是沿着 目标函数减小的 
间的相似性而划分V为 {,…. },            (1)随机选取丘个数据对象作为初始簇  方 向进行 ,若初始化落在了一个局部极小 
cf f=1,2,..., ,且u  =V的过程  的重心;                         点附近 ,就会造成算法在局部极小点收敛。 
叫做聚类 。叫做簇 。                   (2)计算数据对象与各个簇 的重心的距 
   聚类分析作为一个独立的工具能使我         离,将对象分配到距离其最近 的重心所代  3k-means算法的现有改进 
们获得数据的分布情况 ,观察每个簇的特  表的簇 ;                               根据k-means算法的缺点,许多研究者 
点,并且对特定的某些簇做进一步的分析 。          (3)重新计算各个簇的数据对象的平均  提出了k—means算法的变体。这些变体可能 
对于聚类分析 ,国内外 的学者 已经广泛地  值,即重心 ;                         在初始簇的选择、相异度的计算和计算聚 
研究了许多年 ,并且也提 出了许多聚类的          (4)若每个簇 的重心都不再变化 ,或者  类重心 的策 略上有所不 同 。目前 ,对k— 
算法 ,常用的有k-means算法 ,CLIQUE算  指定的收敛准
                您可能关注的文档
最近下载
- 10月份最新热点时事素材!(新闻话题+作文运用+时评).doc VIP
 - 人像摄影摆姿指南与摆姿策略PPT.pptx VIP
 - 医院临床应急演练流程脚本.docx VIP
 - 人教版2024--2025学年度第一学期一年级数学上册期末测试卷及答案(含四套题).doc VIP
 - 《计算机应用基础》习题册加答案解析.pdf VIP
 - 2025年《计算机应用基础》习题及答案.pdf VIP
 - 2020年桂林理工大学877C语言程序设计考研真题.pdf VIP
 - 科学实验实操讲解PPT模板.pptx VIP
 - 综合实践记录我们的校园(教案)2025-2026学年度北师大版数学三年级上册.pdf VIP
 - 海德堡SM52-PM52墨辊的安装和调试.doc
 
原创力文档
                        

文档评论(0)