- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向数字城管的数据分析与挖掘系统的设计与开发.doc
面向数字城管的数据分析与挖掘系统的设计与开发
摘 要: 数字城管在现代城市管理中具有重要的意义。介绍了一个面向数字城管的数据分析与挖掘系统的具体设计和实现,该系统基于Java EE平台开发,综合利用了统计分析方法和范例推理技术,能够提供对城市管理的科学决策。
关键词: 数字城管; 数据挖掘; 统计分析; Java EE
中图分类号:TP31 文献标志码:B 文章编号:1006-8228(2013)08-80-03
0 引言
数字化城市管理(简称“数字城管”)是现代城市的发展趋势,也是城市管理走向现代化的必然要求。实施数字城管,可以创新城市管理模式,再造城市管理流程,实现电子政务资源的整合与共享,从而提升政府城市管理水平和公共服务能力[1]。
近年来,许多国外发达城市相继开展了数字城管的研究和实践,实施数字城管也已成为中国城市管理建设的热点。2005-2007年,国家住房和城乡建设部先后确定了51个数字城管试点城市[2],目前全国已有300多个城市已建立了数字城管。以浙江省杭州市为例,2006年8月杭州市顺利通过国家建设部的验收,成为首批十个数字城管试点城市中第一个通过验收的城市,其创新模式被冠名为“杭州模式”[3];至2010年底,杭州市已建成覆盖城市市域的市辖城域数字城管统一平台。
在数字化城市管理建设过程中,数字城管信息系统综合利用计算机、网络、通讯和数据库等技术,积累了大量庞大又宝贵的数据[4]。从这些海量的原始数据中分析挖掘更实用、更全面的信息,对于城市管理的科学监管和执法具有重要的意义。
本文采用主流的Java EE技术,结合Spring和Hibernate框架,设计并实现了一个面向数字城管的数据分析与挖掘系统。系统充分利用统计分析方法和数据挖掘技术,能对数字城管信息进行综合分析和有效挖掘,为城市管理的科学决策提供全面、直观的依据。
1 系统总体设计与分析
1.1 系统总体需求分析
面向数字城管的数据分析与挖掘系统针对数字化城市管理领域采集的主要信息,例如行业监管业务数据、“四化”督查业务数据和城管执法业务数据等海量数据,综合利用统计分析方法[5]和范例推理技术(Case-Based Reasoning,CBR)进行数据挖掘[6],提取有价值的信息,进一步促进数字城管应用的知识发现和辅助决策,提升城市管理的水平和效能。
系统的主要功能模块包括:系统管理、简单分析、高级分析、分析查询和结果导出等。
系统管理:实现用户管理(包括用户登录、创建和修改)和信息管理(问题、案件的管理)。
简单分析:选取简单的维度、指标字段进行分析,作废分析等。
高级分析:选取复杂的维度、指标、图形区域等进行分析,包括钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)等分析。
分析查询:提供历史的分析管理和记录查询。
结果导出:导出分析结果,包括简单报表、图形报表等。
系统的基本功能框架如图1所示。
1.2 系统关键技术
系统的关键技术主要包括以下几个方面。
⑴ 系统的技术选型采用目前成熟、先进的Java EE技术,符合主流MVC框架的设计架构,系统在软件上充分考虑可扩充性,软件系统采用模块化设计,注重提高系统的可移植性、安全性、可伸缩性和可重用性;同时采用插件式的方式集成系统中的各个模块,保证各个模块的松散耦合、集中统一。
⑵ 利用统计分析方法研究数字城管数据之间的关联关系。确定数据库字段之间存在的函数关系(能用函数公式表示)和非函数关系(不能用函数公式表示),通过统计海量数据中的最大值、最小值、平均值等常用统计方法,以及回归分析、相关分析、差异分析等常用分析方法,对数字城管业务的数据进行统计分析,挖掘出数据间存在的规律性和相关性。
⑶ 利用范例推理技术促进数字城管领域的辅助决策。现有的数字城管信息系统提供了大量的案例数据,系统采用CBR技术进行基于案例库的范例推理建模,利用常用的归纳索引法构建案例决策树,提取案例的显著特征,当出现新的案例时,首先在案例库中检索和整合最相似的案例,为新案例快速提供一个参考的解决方案,从而实现对城市管理的辅助决策。
1.3 数据库设计
系统共设计了员工、地点、问题、监管案例等12张数据表,部分数据表的描述如下:
⑴ 员工表:存储工作人员信息,包括姓名、编号和联系方式等基本属性;
⑵ 地点表:存储发生问题的地点信息,包括编号、区域、街道、社区等基本属性;
⑶ 问题表:存储对问题事件的描述,包含编号、来源、类别、状态等属性;
⑷ 监管案例表:存储所有立案的问题或事件信息,包括案例信息、处理信息等。
其中,
文档评论(0)