- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Rough 集数据挖掘在犯罪人口数据库中的应用
1 2 3 1
林和 ,莫照 ,虞龙江 ,李永礼
1 兰州大学信息科学与工程学院软件所,兰州 (730000)
2 湖南城市学院 计算机系,湖南益阳 (413000) ;
3 兰州市公安局通信处,兰州 (730030)
E-mail :linhe88@
摘 要:以粗糙集方法为基础,利用数据挖掘中的关联规则对犯罪人员数据库的职业结构
进行定量分析、推断和提取规则,把犯罪的定量分析技术应用到犯罪学领域,为决策提供依
据和预防犯罪提供理论上的指导。
关键词:数据挖掘,关联规则,定量分析,粗集理论
1. 引言
人类社会在预防和控制犯罪方面积累了大量的实际经验,犯罪学的研究成果为预防犯罪
提供了理论上的指导;另外在治理犯罪方面我国不仅有可靠地政治保障和组织保障,而且与
国际刑警组织的合作交流提供了有利条件,这些措施使预防犯罪成为可能。我国的犯罪研究
侧重于定性分析,诸如从社会、阶级、家庭等影响来分析犯罪原因,这是分析犯罪研究的一
个重要方面;它的另一方面是定量分析,即探索犯罪现象量的规律性。比如说,某些犯罪现
象在今后一定时间内可能会下降或增长,其下降或增长的数量是多少?在某一时期,犯罪集
中在哪类职业的人?哪个年龄段等。预测犯罪既需定性分析,也需定量分析,这样在我国社
会主义市场经济的大环境中,预测犯罪定量分析就显得尤为重要[2] 。
预防犯罪是维护社会秩序的重要手段,同时也是治理犯罪的最根本途径。预测犯罪是搞
好预防犯罪的前提条件,是制定预防犯罪战略、对策和实施的基础。对其研究通常分为以下
几个步骤:⑴确定研究范围;⑵犯罪数据的收集整理;⑶确定选择采用的分析方面和方法;
⑷数据分析;⑸对数据结果评估,为决策提供依据。利用Rough 集[1,5]与Data Mining[4,6]技术,
借助计算机强大的数据处理能力,对犯罪人员的构成及犯罪行为进行分析、推断和提取规则,
把犯罪的定量分析技术应用到犯罪学领域,为决策提供决策依据和预防犯罪提供理论上的指
导,有着重要地意义。
2. 模糊聚类的算法实现
在模糊聚类分析中,对于各个不同的λ∈(0,1),可得到不同的分类,下面是模糊聚类的
算法实现:
⑴ 数据标准化
①数据矩阵的建立 设论域 U= (x ,x ,…,x )为被分类对象,每个对象由 m
1 2 n
个指标表示其性状:x = (x x , … , x )(i=1…n) 。
i i1 i2 im
②数据标准化 将数据压缩到区间[0,1]上。通常需要作如下两种变换:(平移)
标准差变换;(平移)极差变换。
⑵ 标定(建立模糊相似矩阵[3] )
设论域U= (x ,x ,…,x ),x = (x ,x ,…,x ),依照传统的聚类方法确定相似
1 2 n i i1 i2 im
系数,建立模糊矩阵,x 与 x 的相似度r =R (x ,x ),采用相似系数法的数量积法来确定
i j ij i j
rij ;
- 1 -
1 i=j
rij=
m m
∑ xik .xjk /M i≠j ,其中M
文档评论(0)