- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于复合形粒子群算法的改进K—MEANS聚类算法
第7卷 第lO期 软 件 导 刊 V01.7NO.1O
2008年 lO月 S0ftwareGuide Oct.2008
一 种基于复合形粒子群算法的改进k—means聚类算法
易云飞 ,吴启明 ,唐凤仙
(1.中南民族大学 计算机科学学院,湖北 武汉 430074;2.河池学院 计算机与信息科学系,广西 宜州 546300)
摘 要:针对k—means算法事先必须知道聚类的数 目,难以确定初始 中心以及 受异常点影响很大等缺点 ,提 出了一种
改进的k—means聚类算法。改进后 的算法首先使用复合形粒子群算法来选取聚类的初始中心点 ,然后使用k-means算
法快速收敛获取聚类结果。Iris测试数据集的实验结果表明了改进后的算法能够合理区分不 同类型的簇集,可以有
效地识别异常点,具有较好的性能。
关键词:复合形法;粒子群优化算法;k-means算法;聚类
中图分类号:TP312 文献标识码 :A 文章编号:1672—7800(2008)10—0046—02
(1)所示 :
0 引言 C n
∑∑p (1)
j=l k=l
聚类分析是数据挖掘领域重要的研究课题之一 。所谓 聚
其中,j=l,2,…,c;mj~C个聚类的中心 ,它的值为簇Ci的均
类 .是指根据输入记录 自身的属性和相互 间的关系 ,把具有高
值 ,即
相似度的对象放在一个簇里 ,同时尽量把具有高相异度的对象
放在不 同的簇中的一种技术 。k-means聚类算法是应用最为广 = ∑ (2)
泛的聚类算法之一 ,因为它具有较低 的计算复杂性 、收敛速度 , k=l
k-means算法 的处理过程 :
快以及能处理大数据库等优点。但是 ,该算法也存在着不足之
处:k个初始聚类中心点的选取对聚类结果有较大的影响,同时 (1)从n个数据对象集 x,xz,…,X}中随机选取k个对象{y。,
由于该算法是采用梯度法求解极值 ,结果可能只是局部而非全 y2,…,Yk}作为初始聚类 中心 ;
(2)计算各对象到中心对象的距离 ,并根据最小距离重新
局最优。
考虑到k—means算法的先天不足 ,本文提出了一种基于粒 划分 :
(3)更新簇的平均值 ,即计算每个簇中对象的平均值;
子群和复合形法的改进 的k均值 聚类算法 (Complex—PSOand
(4)循环 (2)到 (3),直到每个聚类不再发生变化时算法终
k—meansClusteringAlgorithm),简称COPSOK算法。改进后的k—
止 。
means算法可以选择适 当的初始聚类中心点.同时也能得到更
您可能关注的文档
- 利发盛镇中学:关心下一代.doc
- 2013高考取胜三十六计.pdf
- 新奥法施工隧道施工阶段监控量测的实施.pdf
- 甄嬛传给HR的10个启示.doc
- 基坑土方开挖及围护监理细则.doc
- 到香港读书必须知道的30件事.doc
- 废铁悄项目商业计划书(2013年融资成功案例范文)-协助企业融资-投资专家免费咨询.pdf
- 安川伺服培训资料.pdf
- テイル形、テイタ形の意味の捉え方に関する一考察 庵功雄.pdf
- 前瞻世界发展大势 谋划中国科技战略.pdf
- 实验室危废随意倾倒查处规范.ppt
- 实验室危废废液处理设施规范.ppt
- 实验室危废处置应急管理规范.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第20课时 中国的地理差异.ppt
- 初中地理中考总复习精品教学课件课堂讲本 基础梳理篇 主题10 中国的地理差异 第21课时 北方地区.ppt
- 危险废物处置人员防护培训办法.ppt
- 危险废物处置隐患排查技术指南.ppt
- 2026部编版小学数学二年级下册期末综合学业能力测试试卷(3套含答案解析).docx
- 危险废物处置违法案例分析汇编.ppt
- 2026部编版小学数学一年级下册期末综合学业能力测试试卷3套精选(含答案解析).docx
最近下载
- 加油站安全生产管理台账21种台账样本(完整版).pdf VIP
- 培智学校八年级下册生活语文期末卷ABCD卷.pdf VIP
- Bosch博世 墙体探测器 D-tect 120 Professional 说明书.pdf
- 通力电梯KCE无机房电气原理图纸2017.pdf
- 博士课程-中国马克思主义与当代(2024年修)习题答案.docx VIP
- 2026届广东东莞中学、广州二中、惠州一中、深圳实验、珠海一中、中山纪念中学六校高二上学期十二月联考物理试卷.docx VIP
- 新高考CD篇阅读备考(基于语篇结构)课件(共24张PPT)-2025届高三英语二轮复习.pptx VIP
- 2022年无锡市物业服务收费管理规定.doc VIP
- 中华系列期刊目录.doc VIP
- 管理运筹学(第四版)韩伯棠全套PPT课件.pptx
原创力文档


文档评论(0)