- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类算法在市政绩效评估中应用
聚类算法在市政绩效评估中应用
摘要摘要:针对Kmeans聚类算法,结合市政绩效评估的需要进行改进。以稳定Kmeans聚类算法中心和选取最优聚类个数为目的,提出基于Kruskal算法和轮廓系数法的Kmeans聚类算法。针对区县不同结构实际市政绩效评估数据,按照商业智能和IQR规则进行预处理,然后利用改进的Kmeans聚类算法对预处理后的数据进行聚类分析。实验结果表明,该算法能够有效地确立各市政事件、部件的发生频数等级,帮助市政管理者发现各市政事件、部件之间关联关系,提高其科学决策能力。
关键词关键词:Kmeans聚类算法;Kruskal算法;轮廓系数法;IQR;商业智能
DOIDOI:10.11907/rjdk.1511214
中图分类号:TP312
文献标识码:A文章编号文章编号2015)011004803
基金项目基金项目:
作者简介作者简介:张小川(1965-), 男,重庆人,重庆理工大学计算机科学与工程学院教授,研究方向为人工智能、人工生命、计算机软件;严杰(1991-),男,重庆人,重庆理工大学计算机科学与工程学院硕士研究生,研究方向为数据库管理、数据挖掘、数据分析。
0引言
智慧城市是信息化社会中一种以网络为依托,智能融合,全民参与城市塑造的数字城市的高级形态。智慧城市要落地,数字城管是基础[1]。而数字城管是一种能够对城市实现敏捷、高效、全方位、全时段覆盖,并且与传统城市管理不同的全新的城市管理模式[2]。实际上,在十二五期间,数字城管的数据体系、软件体系、应用体系和保障体系已基本建成,为智慧城市建设奠定了坚实的基础。由于信息互联互通与数据共享程度低、建设实效和作用不明显、标准体系与政策法规滞后等问题,造成了数字城管的人力、物力、财力和信息资源浪费。因此,为了提高数字城管管理效率,建立一个科学、合理的绩效评估体系尤为必要。市政绩效评估体系是指在合理制度安排和新的公共行政理念的指导下,运用科学的政府管理方法,提高市政行政管理效率,降低管理成本为目的的综合行政评价体制[3-4]。数字城管每天都在产生大量杂乱无章、价值密度相对较低的数据,如何在指定时间内对这些数据进行提取、管理、处理、整理、分析,并建立一个科学的市政绩效评估体系是一个亟待解决的问题。基于此,文章首先利用商业智能和IQR对已有的市政绩效评估数据进行数据预处理;其次,对改进的Kmeans聚类算法与传统Kmeans聚类算法进行比较,证明改进的Kmeans聚类算法的可靠性;最后,对改进的Kmeans聚类算法的结果进行分析,证明其有效性。
1研究综述
自Kmeans聚类算法由MacQueen于1967年提出以来,Kmeans聚类算法以其简单和易于实现的特点使其成为经典的划分型聚类算法,被广泛使用[5]。由于传统的Kmeans聚类算法存在对初始聚类中心选择敏感,并且需要人工指定聚类个数的问题,因此,很多学者提出了改进的Kmeans聚类算法。
文献[6]基于最小生成树的思想,文献[7]基于密度和欧氏距离积的思想,文献[8]基于粒子群和密度的最大最小距离法的思想,文献[9]基于层次聚类的思想,文献[10]基于距离矩阵的思想,文献[11]基于最小方差的思想,文献[13]基于距离和权值的思想,提出了稳定初始聚类中心的Kmeans聚类算法。
针对最优聚类个数选择问题,大多数聚类算法都是通过聚类有效性评估函数的计算来确定。文献[14]综述了各种聚类有效性评估函数。文献[15]基于DS证据理论,把各种聚类有效性评估函数结合起来,提高了聚类评估的有效性和可靠性。
本文提出基于Kruskal算法和轮廓系数法的Kmeans聚类算法,并将其应用于经过数据预处理的市政绩效评估。实验结果表明,文章提出的算法能够对市政事件、部件有效地进行聚类。使市政管理者更容易发现市政事件、部件的关联关系,确立市政事件、部件的频数等级,从而有利于科学决策。
3实验
3.1数据预处理
商业智能就是利用数据管理功能,将从多个数据源中抽取的数据进行整理、转换和清理,并利用OLTP、OLAP对数据进行分析,最终形成报表。本文利用SQL Server 2008 R2 BI提取原始的某区的市政绩效评估数据,并对数据进行整理,最终形成相关维度表、事实表。利用SQL进行查询,得到的结果如表1所示。表1中,第一列表示市政事件、部件的名称和编号,第一行表示统计周期,表中数据表示的是某一市政事件、部件在某一统计周期内总共发生的次数。
由于表中数据存在孤立点,因此为避免改进的Kmeans聚类算法产生局部最优,需要利用IQR规则进行数据清洗。结果排除了无照经营游商(54)、乱堆物堆料(57)、暴露垃圾(79
原创力文档


文档评论(0)