基于自适应布谷鸟搜索算法K―means聚类算法及其应用.docVIP

基于自适应布谷鸟搜索算法K―means聚类算法及其应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于自适应布谷鸟搜索算法K―means聚类算法及其应用

基于自适应布谷鸟搜索算法K―means聚类算法及其应用   摘要:针对原始K-means聚类算法受初始聚类中心影响过大以及容易陷入局部最优的不足,提出一种基于改进布谷鸟搜索(CS)的K-means聚类算法(ACS-K-means)。其中,自适应CS(ACS)算法在标准CS算法的基础上引入步长自适应调整,以提高搜索精度和收敛速度。在UCI标准数据集上,ACS-K-means算法可得到比K-means、基于遗传算法的K-means(GA-K-means)、基于布谷鸟搜索的K-means(CS-K-means)和基于粒子群优化的K-means(PSO-K-means)算法更优的聚类质量和更高的收敛速度。将ACS-K-means聚类算法应用到南宁市青秀区“城管通”系统的城管案件热图的开发中,在地图上对案件地理坐标进行聚类并显示,应用结果表明,聚类效果良好,算法收敛速度快。   关键词:数据挖掘;K-means聚类;布谷鸟搜索算法;数字城管;热图   中图分类号:TP391; TP183   文献标志码:A   0引言   随着我国数字化城市管理事业建设的推进,基于城市管理综合数据的智慧城市应用越来越受到重视。数字城管系统在建设与运行的过程中,不断丰富了城市管理的基础数据,如基础地形图、卫星遥感影像数据、城市管理部件数据、城市管理案件数据等。这些庞大的城市管理综合数据为数据的空间分析、聚类分析、辅助决策等提供了重要载体。而如何从海量的城管数据中发掘出有用的信息为城市管理所运用已成为目前智慧城市建设中研究的热点问题之一。利用数据挖掘技术从城市管理的案件地理数据中发现隐含的有用信息,从时间维度和空间维度分析城市管理问题的高发时段、高发区域,分析城市管理问题的发生、发展等动态变化过程,这在灾害天气频发时进行实时预警、对领导决策提供辅助等方面能起到重要作用。   数据挖掘作为一个热门的多学科交叉应用领域,正在各行各业中扮演着重要的角色。人们可以通过数据挖掘技术从大量的原始数据中提取、发现有重要价值的信息,并应用于实际的生产中。常用的数据挖掘方法有分类、估计、预测、相关性分组、聚类等。聚类分析是一种常用的无监督数据挖掘方法。K-means算法作为一种经典的聚类算法具有简单高效等优点,因此得到广泛应用。因此,在汇集城市案件地理坐标数据的基础上,通过K-means聚类分析算法分析出案件在城区的分布规律,通过热图的形式直观地展现出来,这对于部门领导制定相关策略具有重要的意义。   然而,原始的K-means聚类算法存在对初始聚类中心的选择比较敏感、聚类结果不稳定等缺陷[1]。因此,原始的K-means聚类算法对城市案件地理位置数据的聚类分析效果不是很理想。近年来出现了一些对原始K-means算法改进的新算法。其中,一个重要的研究方向就是将一些元启发式优化算法与K-means算法相结合,利用优化算法的全局优化能力来改善K-means算法的聚类结果。   布谷鸟搜索(Cuckoo Search, CS)算法[2]是一种新型元启发式算法,它采用Lévy飞行搜索机制,具有很强的全局搜索能力。此外,CS算法还具有输入参数少、结构简单、易于实现等优点[3];但CS算法也存在着局部搜索能力较差、后期收敛速度慢等缺点[4]。因此,陆续出现了一些对原始CS算法的改进算法[5-8],如动态适应的CS算法[9]、逐维改进的CS算法等[10]。由于CS算法中的步长因子很大程度上控制着算法的搜索精度,因此,本文采用新的自适应的步长因子来改进原始CS算法,使得该算法能够在全局搜索和局部搜索之间保持很好的平衡,提高CS算法的收敛速度。   本文首先在CS算法的基础上,对算法中Lévy飞行的步长控制量α作自适应调整,提出自适应CS(Adaptive Cuckoo Search, ACS)算法;然后,将ACS算法引入K-means聚类算法,利用ACS算法对聚类中心进行优化,提出了一种基于改进布谷鸟搜索算法的K-means聚类算法(ACS-K-means);最后,将该算法应用于南宁市青秀区“城管通”系统[13]案件数据的聚类分析,并结合热图技术开发了城管决策辅助系统[12],有助于相关领导快速作出决策,提高城管系统的运行效率。   1 K-means聚类算法   K-means聚类算法是一种基于划分的经典聚类算法。该算法的流程如下:   1)从n个数据样本中任意选取k个样本作为初始的聚类中心点;   2)根据每个聚类的均值(即中心样本),计算每个样本与这些中心样本的距离,并根据最小距离对样本进行划分;   3)重新计算每个有变化的聚类的均值。   重复步骤2)到3),直到每个聚类都不再发生变化为止。   2改进的布谷鸟搜索算法   CS算法通过模拟布

文档评论(0)

130****9768 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档