基于逆向FP一树的频繁模式挖掘算法-计算机应用.PDF

基于逆向FP一树的频繁模式挖掘算法-计算机应用.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于逆向FP一树的频繁模式挖掘算法-计算机应用.PDF

第25卷第6期 计算机应用 Vo1.25 No.6 2005年6月 Computer Applications June 2005 文章编号:1001—9081(2005)06—1385—03 基于逆向FP一树的频繁模式挖掘算法 赵艳铎,宋斌恒 (清华大学软件学院,北京100084) (yanduozh@eyou.com) 摘 要:提出了一种称为逆向FP一合并的算法,该算法逆向构造FP一树并通过在其中寻找频繁扩 展项集与合并子树来挖掘频繁模式。新算法在时空效率方面均优于FP一增长算法,其中时间效率提 高了2倍以上。此外,新算法还具有良好的伸缩性。 关键词:数据挖掘;频繁模式;逆向FP一树;逆向FP一合并算法;频繁扩展项 中图分类号:TP311.12 文献标识码:A Algorithm for mining frequent patterns based on converse FP-tree ZHAO Yan—duo,SONG Bin—heng (School ofSoftware,Tsinghua University,Be~iing 100084,China) Abstract:It proposed an algorithm for mining frequent patterns by finding the frequent extensions and merging sub-trees in a conversely constructed FP-tree.The performance of the algorithm is superior to the one of FP-Growth both in time and space consuming.It runs over two times faster than the FP-Growth and has a good scalability. Key words:data mining;frequent pattern;conversed FP··tree;conversed FP--merging algorithm;frequent extension item min _ sup。如果项集满足最小支持度,则称该项集为频繁项集, 0 引言 频繁.j}一项集的集合通常记作雎。 FP.增长算法 是一种本质上不同于Apriori算法…的挖 给定项集,={il, ,…, },事务数据库D={n, , 掘频繁模式的有效算法。FP—增长算法只需两次扫描数据库, … , },其中每个事务Ti(i c[1,2,…,n])包含事务ID号 而且不用产生大量候选项集,将发现长频繁模式的问题转换 TID和一个,中项的子集。,的子集也是项集或模式,根据定 为递归发现一些短模式,然后连接后缀。该方法降低了搜索 义,项集 的支持度计数sup_count(X)是D中包含项集的事 开销,大约比Apriori算法快一个数量级。 务数; 的支持度support(X)=sup_count(X)/I D I,其中 FP增长算法开辟了有效挖掘频繁模式的新途径。然而, I D I是D中事务的个数。 它的时间和空间效率仍需要进一步改进。文献[3]改进了 1.2 关联规则的挖掘 FP-树,提出了一种基于被约束子树的挖掘方法,改进了树中 关联

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档