改进型Apriori算法在犯罪关联分析中应用.docVIP

改进型Apriori算法在犯罪关联分析中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
改进型Apriori算法在犯罪关联分析中应用

改进型Apriori算法在犯罪关联分析中应用   摘要:介绍了关联规则数据挖掘技术,特别是Apriori核心算法,并对Apriori算法进行了Hash优化。以某市的犯罪信息数据库为实例,将改进后的关联分析技术应用其中,以便发现犯罪行为特点及犯罪嫌疑人特性等潜在的联系,为公安部门的战略部署、决策指挥、侦查破案、治安管理等提供依据。   关键词关键词:犯罪特征;关联规则;数据挖掘;Apriori   中图分类号:TP312文献标识码:A文章编号文章编号2013)011006802   0引言   信息技术的飞速发展,给公安机关的信息化应用提供了强有力的保障,较大程度上提高了整个公安队伍的战斗力,在防范打击违法犯罪、维护国家安全稳定等方面起到了重要作用。“金盾工程”的推进,促使各类业务应用平台逐步建成和完善,但情报导向的信息应用仍处于初探阶段。信息的关键价值不在于存储,而在于对所拥有的大量警务信息进行二次挖掘,获取更有价值的情报信息\[1\]。近年来,公安部门积累了海量的基础数据和犯罪数据信息,但对于这些数据的高效利用和深度应用未有明显成绩。因此,如何利用先进的信息技术在这些海量数据中进行深度挖掘,得出一些新知识,使之有益于公安部门的战略部署、决策指挥、侦查破案、治安管理等,具有一定的时代意义。   1关联规则挖掘   关联规则挖掘,有时也叫关联分析,是数据挖掘的一个重要研究领域。它是指从事务数据库、关系数据库和其它信息存储中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性,即所谓的关联规则。其形式为:“X=Y”,即在设定的高置信度的规则下,X事件发生了,Y事件必然发生。   关联规则挖掘核心算法为著名的Apriori算法。当然,此后出现了一些相关算法,诸如DIC算法 \[2\]、DLG算法\[3\]和 DHP算法\[4\]等,都是基于Apriori算法做了改进或优化而成的。   1.1Apriori算法   Apriori算法,是一种挖掘布尔关联规则频繁项集的算法,是Agrawal.R 、Imieliński.T等人在1994第20届大型数据库国际会议上提出的\[5\],于当时最具影响力。此算法实质是一个逐层迭代搜索的方法,利用K项集探索K+1项??。第一次,找出频繁1项集的集合,记为L1;第二次,利用L1探索L2,找出频繁2项集,记为L2;如此进行探索,直至频繁项集K为空,停止。   算法描述如下:   Input: Database D, of transactions; minimum support threshold;   Output: L, frequent itemsets in D   Method:   (1) L1=find_frequent_1-itemsets(D);   (2) For(k=2; Lk-1≠Φ; k++){   (3) Ck=apriori_gen(Lk-1, min_sup);   (4) for each transaction t∈D{   (5) Ct=subset(Ck,t);   (6) for each candidate c ∈Ct;   (7) c.count++;   (8) }   (9) Lk={ c∈Ck |c.count≥min_sup};   (10) }   (11) return L=∪kLk;   Procedure apriori_gen(Lk-1:frequent(k-1)-itemsets; min_sup: support)   (1) for each itemset l1∈ Lk-1   (2) for each itemset l2∈ Lk-1   (3) if(l1\[1\]= l2 \[1\])∧ (l1\[2\]= l2\[2\]) ∧…∧(l1\[k-2\]= l2\[k-2\])∧ (l1 \[k-1\]= l2 \[k-1\]) then {   (4) c=l1∪ l2;   (5) if has_infrequent_subset(c, L k-1) then   (6) delete c;   (7) else add c to Ck;   (8) }   (9) return Ck;   Procedure has_infrequent_subset(c: candidate k-itemset; Lk-1:   frequent(k-1)-itemsets)   (1) for each(k-1)-subset s of c   (2) if s !∈L k-1 then   (3) return tru

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档