- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进型Apriori算法在犯罪关联分析中应用
改进型Apriori算法在犯罪关联分析中应用
摘要:介绍了关联规则数据挖掘技术,特别是Apriori核心算法,并对Apriori算法进行了Hash优化。以某市的犯罪信息数据库为实例,将改进后的关联分析技术应用其中,以便发现犯罪行为特点及犯罪嫌疑人特性等潜在的联系,为公安部门的战略部署、决策指挥、侦查破案、治安管理等提供依据。
关键词关键词:犯罪特征;关联规则;数据挖掘;Apriori
中图分类号:TP312文献标识码:A文章编号文章编号2013)011006802
0引言
信息技术的飞速发展,给公安机关的信息化应用提供了强有力的保障,较大程度上提高了整个公安队伍的战斗力,在防范打击违法犯罪、维护国家安全稳定等方面起到了重要作用。“金盾工程”的推进,促使各类业务应用平台逐步建成和完善,但情报导向的信息应用仍处于初探阶段。信息的关键价值不在于存储,而在于对所拥有的大量警务信息进行二次挖掘,获取更有价值的情报信息\[1\]。近年来,公安部门积累了海量的基础数据和犯罪数据信息,但对于这些数据的高效利用和深度应用未有明显成绩。因此,如何利用先进的信息技术在这些海量数据中进行深度挖掘,得出一些新知识,使之有益于公安部门的战略部署、决策指挥、侦查破案、治安管理等,具有一定的时代意义。
1关联规则挖掘
关联规则挖掘,有时也叫关联分析,是数据挖掘的一个重要研究领域。它是指从事务数据库、关系数据库和其它信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性,即所谓的关联规则。其形式为:“X=Y”,即在设定的高置信度的规则下,X事件发生了,Y事件必然发生。
关联规则挖掘核心算法为著名的Apriori算法。当然,此后出现了一些相关算法,诸如DIC算法 \[2\]、DLG算法\[3\]和 DHP算法\[4\]等,都是基于Apriori算法做了改进或优化而成的。
1.1Apriori算法
Apriori算法,是一种挖掘布尔关联规则频繁项集的算法,是Agrawal.R 、Imieliński.T等人在1994第20届大型数据库国际会议上提出的\[5\],于当时最具影响力。此算法实质是一个逐层迭代搜索的方法,利用K项集探索K+1项??。第一次,找出频繁1项集的集合,记为L1;第二次,利用L1探索L2,找出频繁2项集,记为L2;如此进行探索,直至频繁项集K为空,停止。
算法描述如下:
Input: Database D, of transactions; minimum support threshold;
Output: L, frequent itemsets in D
Method:
(1) L1=find_frequent_1-itemsets(D);
(2) For(k=2; Lk-1≠Φ; k++){
(3) Ck=apriori_gen(Lk-1, min_sup);
(4) for each transaction t∈D{
(5) Ct=subset(Ck,t);
(6) for each candidate c ∈Ct;
(7) c.count++;
(8) }
(9) Lk={ c∈Ck |c.count≥min_sup};
(10) }
(11) return L=∪kLk;
Procedure apriori_gen(Lk-1:frequent(k-1)-itemsets; min_sup: support)
(1) for each itemset l1∈ Lk-1
(2) for each itemset l2∈ Lk-1
(3) if(l1\[1\]= l2 \[1\])∧ (l1\[2\]= l2\[2\]) ∧…∧(l1\[k-2\]= l2\[k-2\])∧ (l1 \[k-1\]= l2 \[k-1\]) then {
(4) c=l1∪ l2;
(5) if has_infrequent_subset(c, L k-1) then
(6) delete c;
(7) else add c to Ck;
(8) }
(9) return Ck;
Procedure has_infrequent_subset(c: candidate k-itemset; Lk-1:
frequent(k-1)-itemsets)
(1) for each(k-1)-subset s of c
(2) if s !∈L k-1 then
(3) return tru
您可能关注的文档
最近下载
- 高中数学选择性必修第一册:2-3-3点到直线的距离公式-教学课件.pptx
- 初中语文 (部编版) 七年级上册(2024修订) 第六单元 24 寓言四则 穿井得一人课件(共19张PPT)).pptx VIP
- 信捷DS3-DS3E-DS3L系列伺服驱动器用户使用手册.pdf
- 2025年运动康复师 老年肌少症预防与康复习题库.doc VIP
- 老年康复习题.pdf VIP
- 大队委竞选个人简介范文.pdf VIP
- 营养指导员理论知识考试题(附答案).pdf VIP
- 2024年注册安全工程师真题答案与解析【法规】.docx VIP
- 个人简历表格下载word(最新).pdf VIP
- 老年康复习题.pdf VIP
文档评论(0)