基于SQL Server 2008数据挖掘系统在违法犯罪人员信息分析上应用.docVIP

基于SQL Server 2008数据挖掘系统在违法犯罪人员信息分析上应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SQL Server 2008数据挖掘系统在违法犯罪人员信息分析上应用

基于SQL Server 2008数据挖掘系统在违法犯罪人员信息分析上应用   摘要: 首先对铁路公安机关情报分析的需求和SQL Server 2008的数据分析服务进行讨论,并着重探讨基于SQL Server 2008的数据挖掘系统在违法犯罪人员信息分析上的应用。经实例证明,该系统实现良好的分析决策功能。   关键词: SQL Server 2008;数据挖掘系统;情报分析   中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0310067-01      0 引言   近年来,随着金盾工程的不断推进,铁路公安部门依托业务信息系统、公安通信网等搜集和积累的数据的规模口益扩大,复杂程度不断增长。但如何运用业务信息数据库构建不同主题的数据仓库,使用OLAP和数据挖掘技术,从海量数据中及时发现、总结各种犯罪的规律性以及铁路治安的变化特点的情报,成为亟待解决的问题。   而SQL Server 2008作为新一代的商业智能平台,是解决上述难题,实现警务智能的利器。其中,Integration Service用于数据预处理阶段,提供数据清理、提取、转换、装载等功能;Analysis Services提供OLAP和数据挖掘功能,依据相关数据为用户分析企业现状和预测未来。   1 Analysis Services功能简介   Analysis Services是用于联机分析处理和数据挖掘的分析服务器,可以构造用于分析的多维数据集,它将数据仓库中的数据组织成包含预先计算聚合数据的多维数据集,以实现即时的复杂分析、查询。Analysis Services还提供一组丰富实用的数据挖掘算法,包括决策树、关联规则、聚集等,用户可使用这组算法挖掘其数据以查找特定的模式。此外,用户还能够依据挖掘的情况,以算法插件的形式输入更有针对性的自定义算法。Analysis Services还实现了数据挖掘和报表服务的集成,可以通过简单且可伸缩的方式为不同需求层次的用户提供分析查询和预测结果,也可以将挖掘结果直接反馈给前端的应用程序,用于数据分析与挖掘的前端展示。   2 违法犯罪人员信息实例分析   以下本文以违法犯罪人员库为数据源,运用OLAP和数据挖掘技术对违法犯罪人员信息分析。   2.1 建立Analysis Service项目   首先建立违法人员信息的Analysis Service项目,它包括数据源、数据源视图、多维数据集、维度、挖掘结构、角色等,是一个完整的数据挖掘项目的解决方案。   2.2 建立数据仓库   实际工作中,对违法人员信息的分析包括对个人基本情况、犯罪行为等,因此建立以违法人员表为事实表,以性别、口音、年龄区间、案别、作案特点、作案手段、管辖单位为维度表的雪花模式的数据仓库。   2.3 OLAP分析   多维数据集进行处理,即可在OLAP浏览器中通过可视化的拖拽,选择有意义的不同维度组合,对违法犯罪人员相关状况的进行数据查询或图表分析。   2.4 数据挖掘   本文将以需求驱动的形式,通过三个实际工作中的案例,重点讨论Microsoft的决策树算法、关联规则算法、聚类算法的应用实例。   2.4.1 案例一。现在我们想要通过Microsoft决策树算法,对案别为盗窃旅财案的违法人员的文化程度与年龄结构进行挖掘。   Microsoft决策树算法是一种混合的决策树算法,通过在树中创建一系列拆分来生成数据挖掘模型。该算法可以解决3种不同类型的数据挖掘任务:分类,回归和关联。Analysis Services对决策树模型处理后,即可以使用决策树查看器来浏览模型的内容。   算法首先根据信息嫡的计算结果,对年龄区间进行分叉。当选择Age Area=“30-40”节点时,在“挖掘图例”中即显示30-40岁之间违法人员的文化程度的比例。可以得出有2180个事例属于该节点,文化程度=小学的概率为82.55%。可以选择节点右侧有加号的节点继续展开树,直至发现感兴趣的节点信息。   2.4.2 案例二。在OLAP中,我们无法通过统计数字,来探究案别、年龄区间、口音、文化程度等属性项目之间的内在联系。现在我们运用Microsoft关联规则算法进行数据挖掘,以期探寻其内在联系。   Microsoft关联规则算法有两个步骤,一是找出频繁项集,二是基于频繁项集来生成。Analysis Services对关联模型处理后,即可以使用关联规则查看器来浏览模型的内容。   依据关联规则模型,用户可以调整最小概率、最低重要性以及筛选规则,定位感兴趣的规则。从规则中发现,利用火车作为交通工具,拐卖妇女、儿童的犯罪分子多来自于云贵两省,年龄多在30-50之间,因此公安机关在途经云贵两省的

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档