【doc】 数据挖掘技术及其在刑侦工作中的应用.docVIP

【doc】 数据挖掘技术及其在刑侦工作中的应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术及其在刑侦工作中的应用 1引言 数据挖掘技术及其在刑侦工作中的应用 ResearchonPublicSecurityUsingData——miningTechnology 张辉 zHANGHu/ AlastradDataMininghasbecomeahotspotinthefieldsofartificialintelligenceanddatabasetechnologyinre’ centyears.Ithasbeenstudiedinmanyfields,butblankinthefieldofpublicsecurity,Manyproblemsarenotwell solvedinthepublicsecurityaccordingtothetraditionalApriorialgorithm,Undersuchcircumstance,theobjectofour workistoimprovethealgorithm,andtestitthroughmodels, KeywordsDataminingAssociationruleApriorialgorithm 数据挖掘技术是近年来数据库和人工智能领域研究的 热点课题,目前在很多领域已有研究,但在公安刑侦工作的 研究中尚处于初级阶段.而当前,随着社会政治,经济和科 学技术的高速发展,现代犯罪行为表现出l『速度化,智能化, 高科技化的特点.从犯罪整体走势看,犯罪发案数量明显上 升,而且伴随着每一次犯罪浪潮都有新的罪种出现,经济犯 罪,金融犯罪,智能犯罪迅速崛起,上升速度非常之快,远远 超过了恶性的,原始的,人的本能的犯罪,同时大案要案所占 比例也有增多.这种情况下,将数据挖掘技术应用于刑侦工 作,及时发现最新规则,以提高执法效率与快速反应能力,及 时的预防与打击犯罪行为,成为公安工作中急需解决的问 题.但由于公安工作的特殊性,目前传统的数据挖掘算法在 刑侦工作中的应用都存在不能解决的问题,本文所作的主要 工作是对数据挖掘技术进行了研究,针对传统的分类规则 Apriori算法在刑侦工作中存在的问题进行了分析,提出了算 法的改进,并通过模型进行了验证. 2数据挖掘技术 数据挖掘(DataMining),也称数据库中的知识发现 (KDD:KnowledgeDiscoveryinDatabase),是指从大型数据库或 数据仓库中提取人们感兴趣的知识,这些知识是隐含的,事 先未知而又潜在有用的信息,提取的知识一般可表示为概念 (Concepts),规则(Rules),规律(Regularities),模式(Patterns)等 形式.用数据库管理系统来存储数据,用机器学习方法来分 析数据,挖掘大量数据背后的知识,这两者的结合促成了数 据挖掘技术的产生.数据挖掘是一门交叉性学科,涉及到机 器学习,模式识别,归纳推理,统计学,数据库,数据可视化, 高性能计算等多个领域. 根据任务,可将数据挖掘技术分为五种:关联,序列,分 *山东警察学院基础部济南250014 类,聚类和数据总结.挖掘的一般过程为:a.选择数据源;● 采集数据;c,计算统计变量,利用图表进行直观描述,从中发 现数据间的关系;d.选定算法,建立预测模型;e,验证模型的 合理性,准确性,对模型加以完善;f,通过模型指导决策.整 个过程反复进行和优化. 数据挖掘是面向应用的,深层次的数据信息分析方法, 最常用的技术方法有: 规则归纳:通过统计方法归纳,提取有价值的if—then规 则,例如关联规则挖掘算法. 决策树方法:用树形结构表示决策集合,这些决策集合 通过对数据集的分类产生规则.国际上最有影响的决策树 方法是由Qu~ulan研制的ID3方法,典型的应用是分类规则挖 掘. 人工神经网络:这种方法模拟人脑神经元结构,是一种 通过训练来学习的非线性预测模型,它可以完成分类,聚类, 特征规则等多种数据挖掘任务.它以MP模型和HEBB学习 规则为基础,建立三类神经网络模型:前馈式网络,反馈式网 络,自组织网络. 遗传算法:这是一种模拟生物进化过程的算法,最早由 Holland于20世纪70年代提出,它是基于群体的,具有随机 和定向搜索特征的迭代过程,这些过程有基因组合,交叉,变 异和自然选择四种典型算法.遗传算法作用于一个有问题 的多个潜在解(个体)组成的群体上,每个个体都有一个编码 表示,同时每个个体依据问题的目标函数被赋于一个适应 值. 模糊技术:利用模糊集合理论对实际问题进行模糊评 判,模糊决策,模糊模式识别和模糊聚类分析.它为数据挖 掘提供了概念和知识表达,定性定量转换,概念的综合和分 解的新方法. 粗(Rough)集方法:它是1982年波兰逻辑学家Z.Pawlak 提出的一种全新的数据分析方法,近

文档评论(0)

cnsg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档