一种基于mfp 树的快速联系规则挖掘算法.pdfVIP

下载本文档

8
0
约1.37万字
约 4页
2017-09-12 发布于山东
举报
版权申诉

一种基于mfp 树的快速联系规则挖掘算法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第17卷_第6期计算机技术与发展 Vol.17 No.6 2007年6月 ’ C)〔入4PITFERTECllNOIJ(X;YANI)1)EVEI刀P入IENT Jun. 2007 一种基于MFP树的快速关联规则挖掘算法李志云，周国祥 (合肥工业大学计算机与信息学院，安徽合肥230009) 摘要:在关联规则挖掘FP一GroM沈h算法的基础上，提出一种基于N『P树的快速关联规则挖掘算法。文中给出了MFP 算法的工作原理。N下1〕算法能在一次扫描事务数据库的过程中，把该数据库转换成MFP树，然后对州『1〕树进行关联规则挖掘。N『P算法比即_Growth算法减少一次对事务数据的扫描，因此具有较高的时间效率。关键词:关联规则挖掘洲田P树;MFP算法中图分类号:T巴01.6 文献标识码:A 文章编号:1673一629X(2007)06一0094一03 AFastAssociation RuleMiningAlgorithmBasedonMFPTree LIZhi一yun，ZHOUGuoxiang (段坛刀lofo刀甲uterInfomlation，HeleiUnivers ityofTechllolof界，Hefei230009，China) A加tract:压巧alonFP一Growthalgoritl扣飞of二 iationrulemln ing，thisPaPerp~ tsanew~ iationrulemininga】go6tllln司1己 MFPTree.The倒[FPa】9止ithnlcan conve rtatransac tiondatal~ intoanMFPtreetllrot唱hscann ingthedatahaseonlyonce ，阴dthendo theminingofthetree .价causethe入吓Pal即石thnlscans atransactiondstaha货one time lessthe砷一910叭rth司即rithnl，the MFPa娜- rithlnisrr幻reefficientwithtime . Keywo川5:二 iat汕川】e而ning;MFPtree ;州『Pal即rithnl 1 概述库，得到L表;第二次扫描事务数据库，构造出外一关联规则的挖掘是数据挖掘研究的重要内容之 tn犯。由于扫描实际的事务数据库的开销很大，若能在一，它反映了大量数据中项目集之间有趣的关联或相此基础上再减少挖掘算法对事务数据库的扫描次数，关联系[l]。关联规则挖掘中最重要的是进行频繁模式则能进一步有效地提高关联规则挖掘效率。为此，设的挖掘[2]。挖掘频繁模式的经典算法是彻riori算法计了一种称之为侧田P的快速关联规则挖掘算法。和FP一G拍wth算法[3]。州田1〕算法有2个基本步骤:一是扫描事务数据库，在助riori算法使用广泛，大家比较熟悉。FP- 扫描过程中就把事务数据库转换成类似于即一tree 的 Growth算法是用于从事务数据库中挖掘布尔型关联树(下面称为州田1〕树)，并且保留了所有事务数据库中规则的频繁模式。它的挖掘过程比较复杂，但是可以 item 间的关联信息;二是挖掘侧田1〕树，从中找出所有简单地划分成三个基本步骤[4]:首先是扫描事务数据可能的关联规则。与FP一Growth算法相比，M下1)算库，根据给出的而爪suP(最小支持度)建立L表;然后法只需对事务数据库扫描1次，因而可提高关联规则第二次扫描事务数据库，依据一L表，构建饰一tree;最挖掘的时间效率困。后对构建的印一tree进行挖掘，找出所有的频繁模式。有了频繁模式就可以根据行业背景方便地建立所需的 2 侧[FP算法的工作原理关联规则[5]。 2.1相关定义尽管FP_Growth算法的关联规则挖掘效率比定义1:事务数据库D。用