- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在电子政务系统中应用
数据挖掘技术在电子政务系统中应用[摘要] 分析了电子政务数据的特点,介绍了数据挖掘方法,结合几个可能的应用例子,探讨了电子政务数据挖掘的实现
[关键词] 电子政务 数据挖掘
1 引言
信息技术的迅速发展和成熟,使得电子政务应用不断深化。电子政务能够辅助政府更好地为公众服务,也能满足人们对政府和职能部门高效运转的要求
从全国范围看,经过多年的实践,电子政务建设和应用初见成效。各级政府在不同的层面建设和实现了不同的功能。这其中建立和获取了很多数据。这些数据中具有一些知识。但目前的系统只是实现数据的输入、查询、统计等功能,还没有能够从中挖掘这些知识。充分利用这些数据,挖掘其中的知识,将能够为政府的决策提供更好的支持,能够更好地满足快速有效服务大众的要求
2 电子政务数据的特点
电子政务涉及面广,因此拥有的数据也是海量而复杂的。归纳起来看,电子政务数据有下面这些特点:
2.1 数据种类多。政府事务和管理涉及很多方面。因此数据类型也丰富。这些数据有统计数字、文本、图像、视频、音频等。数据种类多也使得数据的格式多样
2.2 海量数据。电子政务面向的用户广,业务繁多。随着系统的运行,每天由文本、图像、音频、视频等组成的数据,以及网络服务器访问记录、浏览器日志记录、用户个人信息、用户对话等生成的数据量巨大
2.3 数据的动态性。在电子政务系统运行过程中,各种数据库中的数据都在不断扩充和增加
3 数据挖掘方法
应用数据挖掘时涉及两个方面的问题。第一是算法层面。第二是实现层面
在算法层面,数据挖掘主要来源于机器学习、模式识别等人工智能算法。这包括关联规则、分类、聚类等算法
(1)关联规则挖掘:其目的就是为了挖掘出隐藏在数据间的相互关系
(2)分类:分类算法的输入集是一组样本集合和几种类别标记。首先为每一个样本赋予一个标记,然后训练一个分类器。最后对新样本进行分类
(3)聚类分析:聚类分析法的输入是一组未标记类别的样本,也就是说此时输入的样本还没有进行任何分类。其目的是根据一定的规则,合理地划分样本。而所依据的这些规则是由聚类分析算法定义的,例如,可以是一个准则函数,可以是一条经验规则等
另外,数据挖掘还有一个重要的任务就是将结果呈现给用户,这需要一些机器学习的技术和其他计算机技术
在实现层面,不仅仅要考虑数据,还要考虑数据的存放。由于很多的数据是存放在数据库中,因此,不可避免需要采用数据库技术从而使数据挖掘算法能够更好地实现和更高效的运行
电子政务系统是一个大的系统,涉及的数据多而且丰富,用户众多,访问频繁。因此,电子政务系统通常会采用数据库。所以,在设计和实现挖掘算法的时候,需要充分采用数据库技术,从而使数据挖掘能更好地运行
4 电子政务系统中的数据挖掘功能
形象地说,数据挖掘就是从大量数据中挖掘知识的过程。根据电子政务系统的特点,我们这里给出几种可能从中挖掘到的知识的类型
4.1 用户关注热点的发现
在电子政务网站上,有大量的政策、法规、通告、新闻等文件。用户会根据自己的喜好点击、浏览和下载这些文件。通过网络日志可以记录这些数据。这些数据可以给我们提供一些信息
通过对这些数据的分析,我们可以知道,在一段时间内,大多数用户对哪些,或者哪类的文件有兴趣。由此可以确定用户的关注热点是什么
不仅如此,根据对不同时间段内用户关注热点的跟踪和分析,还可以发现用户关注热点的变化。这些变化能给政府部门人员提供丰富的信息,也可以促使我们寻找变化原因,从而及时作出相应改进以适应这些变化
4.2 用户使用电子政务系统的模式发现
用户在访问电子政务系统时,会以自己喜欢的方式进行操作。根据网络日志,发现用户这些操作的模式,有助于改进电子政务系统
用户的操作模式包括两种类型。一种是大众的操作模式,一种是个人的操作模式
大众的操作模式是指一段时间来,大多数用户对于某一类功能的操作模式。发现这些模式,可以让我们了解大多数人是怎样操作的。由此可以启发我们分析目前的系统设计是否存在问题,是否存在改进的可能
个人的操作模式是指个人在一段时间的操作习惯。根据日志的记录,可以持续对一些用户进行分析,发现其个人操作模式。个人的操作模式和大众的操作模式可能不同。由此我们可以考虑设计面向不同用户的,或者说是用户自适应的政务系统
4.3 用户提交文件的搜索
一些电子政务系统允许用户提交电子文件。数据挖掘算法可以对这些数据进行分析,以提供更好的服务
例如:在公务员招考过程,系统接收到很多报考者填报的数据。数据挖掘系统可以首先对这些大量的数据进行分析。一方面可以提醒某些粗心的报考者,他们填报的数据可能缺少相关的要素。另一方面,还可以从这些大量的数据中
您可能关注的文档
最近下载
- 胎圈钢丝市场洞察报告.pptx VIP
- Starter Unit 2 Keep Tidy Section A 1a-2e 课件 人教版2024七年级英语上册.pptx
- (9号)青岛天信电气500KW变频器培训资料(四象限).ppt
- 传统风貌区打测绘说明书.pdf
- 2025年传染病防治法培训试题及答案.docx VIP
- 金蝶云星空操作手册V3.5.docx VIP
- 《质量管理》试题题库汇总及参考答案 .pdf VIP
- 2024年八个方面检视剖析材料.docx VIP
- 2023燃气-蒸汽联合循环发电工程建设预算项目划分导则.docx VIP
- 基于文旅融合视角的研学旅游产品创新发展研究——以大连市为例.docx VIP
文档评论(0)