一种定位子集的自顶向下挖掘算法研究-计算机工程与应用.PDF

一种定位子集的自顶向下挖掘算法研究-计算机工程与应用.PDF

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一种定位子集的自顶向下挖掘算法研究-计算机工程与应用

142 2011 ,47 (18) Computer Engineering and Applications 计算机工程与应用 一种定位子集的自顶向下挖掘算法研究 方 刚,涂承胜,熊 江 FANG Gang ,TU Chengsheng ,XIONG Jiang 重庆三峡学院 数学与计算机科学学院,重庆 万州 404000 College of Mathematics and Computer Science ,Chongqing Three Gorges University ,Wanzhou ,Chongqing 404000 ,China FANG Gang ,TU Chengsheng ,XIONG Jiang.Research of top-down mining algorithm based on orientation subset.Com- puter Engineering and Applications ,2011 ,47 (18):142-145. Abstract :Aiming at disadvantage of presented top-down mining algorithm that has redundant computing when non-frequent itemsets generate their subsets and prune some repeatedly generated subsets ,an algorithm of top-down mining based on orien- tation subset is proposed ,which is suitable for mining relative long frequent itemsets.The algorithm uses orientation subset to generate subsets of non-frequent itemsets by top-down strategy ,which can efficiently prune redundant subsets and reduce re- peatedly computing to improve its efficiency.Comparing with presented top-down mining algorithms ,the experiments indicate that it is fast and efficient. Key words :orientation subset ;top-down ;long frequent itemsets ;mining algorithm 摘 要:针对现有自顶向下挖掘算法的不足,即在非频繁项目产生子集时和修剪重复产生的子集时存在冗余计算,提出一种基于 定位子集的自顶向下挖掘算法,其适合于挖掘较长频繁项目集;算法按自顶向下策略用定位子集的方法产生非频繁项的子集,并 有效地修剪冗余子集和减少重复计算,提高了算法的效率。实验证明,与现有的自顶向下挖掘算法相比,该算法是快速而有效的。 关键词:定位子集;自顶向下;长频繁项目集;挖掘算法 DOI :10.3778/j.issn. 1002-8331.2011.18.041 文章编号:1002-8331(2011 )18-0142-04 文献标识码:A 中图分类号:TP311 1 引言 法复杂且有冗余计算,修剪重复子集时需要多次比较,不利于 为克服Apriori 算法在挖掘较长频繁项时存在的不足,提 效率提高,特别是当所有项目均属频繁项时,算法要删除的项目 出了DMFIA[1] 、Top-Down-Miner[2] 等改进算法。DMFIA 采用 是非频繁项包含的所有项目,算法效率会很差。针对这些不足, FP-tree 存储结构及自顶向下的搜索策略,有效地提高了最大 提出了一种基于定位子集的自顶向下挖掘算法ATDMBOS 频繁项目集的挖掘效率;但对于频繁项目多而最大频繁项目 (

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档