基于位串数组的最大频繁项目集挖掘算法-计算机工程与科学.PDF

基于位串数组的最大频繁项目集挖掘算法-计算机工程与科学.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于位串数组的最大频繁项目集挖掘算法-计算机工程与科学.PDF

维普资讯 CN43—1258/TP 计算机工程与科学 2006年第 28卷第 6期 ISSN 1007—13OX COMPUTERENGINEERING8LSCIENCE Vo1.28。No.6。2006 文章编号:1007—130X(2006)06—009002 基于位串数组的最大频繁项 目集挖掘算法 A BitStringArray——BasedM iningAlgorithm for M aximum FrequentItemset 张集祥,李桂杰 ZItANGJi-xiang,LIGui-jie (杭州电子科技大学计算机学院,浙江 杭州 310012) (SchoolofComputerSciencetHangzhouDianziUniversity,Hangzhou310012,China) 摘 要:关联规则挖掘的主要性能由发现频繁项目集决定。频繁项 目集是最大频繁项 目集的子集,因而找到所有最大 频繁项 目集是问题的关键。本文使用位串数组的数据结构提出了一种挖掘最大频繁项 目集的算法MMFI。该算法通过位 串与操作直接得到最大频繁项 目集 Abstract:Theperformanceofassociationruleminingisdecidedbydiscoveringfrequentitemsets,andthefrequentitem— setisthesubsetofthemaximum frequentitemset,SOthekeyistofindallthe瑚 ximmu frequentitemsets.Anewalgorithm forminingma ximmu frequentitemsets(MMF])isproposed,whichisbasedonadatastructurecalledbitstringarray。 MMFIdirectlygetsmaximum frequentitemsetsthroughthebitstringandoperation. 关键词:数据挖掘;最大频繁项 目集;位 串数纽 Keywords:datamining;ma ximmu frequentitemsets;bitstringarray 中图分类号:TP31I 文献标识码 :A 次,通过位串与操作直接得到最大频繁项 目集,无需产生候 1 引言 选项 目集 ,算法简单快速。 关联规则的开采是数据挖掘中的一个重要问题 ,其核 2 相关概念 心是频繁模式挖掘。近年来,研究工作者已经研究出了许 多快速的频繁模式挖掘算法,如 Apriori算法 1]『、DHP算 法[纠、Partition算法嘲、FP-growth算法踟、AprioriTid算 2.1 关联规则 法嘲等。 设 {i,iz,…,i)是项 目集合,D是事务数据库,其 Apriori算法是一种最有影响的挖掘关联规则频繁项 中的每个事务 丁是一个项 目子集 (T_Cj),它有一个唯一标 集的算法,它使用一种逐层搜索迭代方法,由频繁}项集生 识符 TID。 成候选频繁(五+1)一项集。首先,扫描数据库,找出频繁1一 定义 1 称事务 T支持项目集X,如果 X T。 项集 ,记作L 。由Lk(五=1,2,…)生成候选频繁(五+1)一项 定义2 称项目集X具

您可能关注的文档

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档