网站大量收购独家精品文档,联系QQ:2885784924

一种新的解决FSC问题的算法.pdfVIP

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种新的解决FSC问题的算法.pdf

鱼夔} zSpE7N(-:E.TE一 - - ,术论坛 一 种 新 的 解 决 F S C 问 题 的 算 法 许 奥 ( 广东轻工职业技术学院 广东 510300) 摘 要:在本文中,我们将回顾为解决翔里奥计数(Fr equent Set Counting F SC) 向题的Ap riori 类算法,并且提出一个新的算法A prior i-3, 原有的经典A pr io ri 算法进行改进. 我们的目标是优化Ap rior i 算法中最耗时的阶段,比如 次颇繁项 目集计数过程. 我们主要通过提出 一种新的存储候选项集和计算它们支持度的方法,同时使用了一种有效的裁剪技术随着算法的执行能够明显的减少数据集的数t . 关健词:教据挖掘 关联规则 FS C Apr ior i , 中圈分类号: TB47 文献标识码: A 文童编号: 167 - 379 1( 007)08(a)- 0 0 - 0 ,FSC问题的介绍 个简单的启发式算法 :注意到一个给定的K 项 集。而是采用直接访向教据结构作为我们算 F S0 1作为数据挖掘过程[.1311冲发现频繁 集 I 属于t 的k- 1子集的个数正好是 k 个 并 法的基仙. 注意到Apr iori 算法在一元频繁项 项集的一个间题已经被广泛的研究过。颇爹 且属于该 k 项集的每个项 目只在它的子集中 集的发现过程中已经采用了直接计算技术。 项集通常被用来抽取关联规则,在事务数据库 出现k 一1 次。因此,我们可以得出一个必要 向上面的讨论那样,大多数的Apr iori 的执行 中以用来表明某些项集的出现可以影响其他 《也是弱) 条件去保持一个给定的项 目在t 中, 时间花费在k 的值比较刁哟 地方。实验表明 项集的出现。产生关联规则的过程可以直接 那就是该项 目至少k - 1次出现在F 卜: 中。为 项 目集的势小于4 的所有情况下的执行时间 的被用到购物篮分析中。 了检查这个条件,我们构建一个全局PI R Gk_, 要 占整个执行时间的90/. , 当k= l 时,Ap riori Ap rioril0是一种非常有效的解决FS C 问 [1去对Fk_,计数。每一个计数和D 的‘m 项集 算法的直接计算技术很有效 ,但对于 k= ,候 题的方法。Ap r io r i 算法是一种最有影晌的 中的一个相对应。对于每个属于Fk_,的频繁 选集C*通常变得很大,Apriori 算法使用哈希 挖掘布尔关联规则频繁项集的算法,其核心是 k - 1项集,在每个频繁项集中出现的项 目的个 树将他们分成小的部分,哈希树的深度依翰于 使用候选项集找频萦项集。使用一种称作逐 数被记录。最后,我们可以看到如果在计数器 k . 而且.Aprior i 算法的产生候选项集C、的 层搜素的迭代方法k 一项集用子搜素(k+ 1)一 G k- 1[t ,] 1 ‘r ‘m 是x ,那么t . 就出现在 计数并不是效率很高,对于k= 时,C 只是等 项集。首先 ,找出频赞 1一项集的集合. 该集 玖-,的x 个频繁项集内。一个项 目吮属于t 被 于F, x 兀 . DHP 的哈希过滤技术能够减少 合记作Fi. F }用于找频萦 一项集的集合F : 保存成t 当且仅当计数大于或等于 k - I 。最 C 中项集的数 目. 然而,在某些情况下这种 F : 而用子找F3,如此下去,直到不能找到频繁 后,如果l t l小于k 那么该事务被略过,应为 减少并不是很充分而且用来计数的哈希树不 项集。找每个需要一次数据库扫

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档