一种基于mfp 树的快速联系规则挖掘算法.pdfVIP

一种基于mfp 树的快速联系规则挖掘算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第17卷_第6期 计算机技术与发展 Vol.17 No.6 2007年6月 ’ C)〔入4PITFERTECllNOIJ(X;YANI)1)EVEI刀P入IENT Jun. 2007 一种基于MFP树的快速关联规则挖掘算法 李志云,周国祥 (合肥工业大学计算机与信息学院,安徽合肥230009) 摘 要:在关联规则挖掘FP一GroM沈h算法的基础上,提出一种基于N『P树的快速关联规则挖掘算法。文中给出了MFP 算法的工作原理。N下1〕算法能在一次扫描事务数据库的过程中,把该数据库转换成MFP树,然后对州『1〕树进行关联规 则挖掘。N『P算法比即_Growth算法减少一次对事务数据的扫描,因此具有较高的时间效率。 关键词:关联规则挖掘洲田P树;MFP算法 中图分类号:T巴01.6 文献标识码:A 文章编号:1673一629X(2007)06一0094一03 AFastAssociation RuleMiningAlgorithmBasedonMFPTree LIZhi一yun,ZHOUGuoxiang (段坛刀lofo刀甲uterInfomlation,HeleiUnivers ityofTechllolof界,Hefei230009,China) A加tract:压巧alonFP一Growthalgoritl扣飞of二 iationrulemln ing,thisPaPerp~ tsanew~ iationrulemininga】go6tllln司1己 MFPTree.The倒[FPa】9止ithnlcan conve rtatransac tiondatal~ intoanMFPtreetllrot唱hscann ingthedatahaseonlyonce ,阴dthendo theminingofthetree .价causethe入吓Pal即石thnlscans atransactiondstaha货one time lessthe砷一910叭rth司即rithnl,the MFPa娜- rithlnisrr幻reefficientwithtime . Keywo川5:二 iat汕 川】e而ning;MFPtree ;州『Pal即rithnl 1 概 述 库,得到L表;第二次扫描事务数据库,构造出外一 关联规则的挖掘是数据挖掘研究的重要内容之 tn犯。由于扫描实际的事务数据库的开销很大,若能在 一,它反映了大量数据中项目集之间有趣的关联或相 此基础上再减少挖掘算法对事务数据库的扫描次数, 关联系[l]。关联规则挖掘中最重要的是进行频繁模式 则能进一步有效地提高关联规则挖掘效率。为此,设 的挖掘[2]。挖掘频繁模式的经典算法是彻riori算法 计了一种称之为侧田P的快速关联规则挖掘算法。 和FP一G拍wth算法[3]。 州田1〕算法有2个基本步骤:一是扫描事务数据库,在 助riori算法使用广泛,大家比较熟悉。FP- 扫描过程中就把事务数据库转换成类似于即一tree 的 Growth算法是用于从事务数据库中挖掘布尔型关联 树(下面称为州田1〕树),并且保留了所有事务数据库中 规则的频繁模式。它的挖掘过程比较复杂,但是可以 item 间的关联信息;二是挖掘侧田1〕树,从中找出所有 简单地划分成三个基本步骤[4]:首先是扫描事务数据 可能的关联规则。与FP一Growth算法相比,M下1)算 库,根据给出的而爪suP(最小支持度)建立L表;然后 法只需对事务数据库扫描1次,因而可提高关联规则 第二次扫描事务数据库,依据一L表,构建饰一tree;最 挖掘的时间效率困。 后对构建的印一tree进行挖掘,找出所有的频繁模式。 有了频繁模式就可以根据行业背景方便地建立所需的 2 侧[FP算法的工作原理 关联规则[5]。 2.1相关定义 尽管FP_Growth算法的关联规则挖掘效率比 定义1:事务数据库D。用

文档评论(0)

精品教学资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档