- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种改进的K_means算法
24 4 ( 29 1) 39
: 1003-5850 ( 2011) 04-00 39-02
K-means
-
An Improved K means Algorithm
安建成 史德增
( 太原理工大学 太原 0 30024)
K -means 算法以其简单性和快速性在文本聚类中得到广泛应用, 但是传统的K -means 算法对初值的依
性很强, 需要事先给出要生成的簇的数目k, 而这 个参数k 的确定 一般是根据用户的经验知识给出的; 另外,
其初始聚类中心是随机选取的, 这种随机性往往导致聚类结果的不稳定。可以说, 不同的k 值和不同的初始聚类
中心对聚类质量和时间效率造成的影响是很大的。实验对改进K -means 算法的有效性进行了验证, 结果证明, 改
进K -m eans 算法能有效地解决传统K -means 算法的随机性所产生的聚类效果不稳定的问题, 其时间复杂度也有
所降低。
聚类, K 均值聚类算法, 初始质心
: T P 30 1. 6 : A
- . , -
ABSTRACT K means alg or i hm w i h i s simplici y and r apidi y is w idely u sed in he ex clu s ering Ho w ev er he r adi ional K
means algo ri hm w as hig hly dependen on he ini ial value, and i needs o give he par ame er k in advance, w hich is alw ays
. , ,
de ermined by know ledg e andex per ience of user s In addi ion he ini ia l clu s er cen er s o f i are r andomly selec ed hisr ando mness
off en led o ins abili y o f clus er ing r esul s . So o speak , he diff er en k v alues anddiff eren ini ial clu s er cen ers had a gr ea impac
. , -
on clu s ering quali y and ime eff iciency r esul s show ed impr oved K means algo ri hm can solve he pro blem of he ins abili yo f
clu s er ing eff ec g enera ed by r ando mness, and i s ime com plex i y w as also decr eased .
, - ,
KEYWORDS clu s ering K means clu s ering algo ri hm ini ial cen r e of mass
( ,
) , ,
, ,
,
文档评论(0)