§2第四章2MiningCompressedFrequentPatternSets(1338KB).pptVIP

  • 4
  • 0
  • 约6.21千字
  • 约 44页
  • 2018-04-09 发布于广东
  • 举报

§2第四章2MiningCompressedFrequentPatternSets(1338KB).ppt

RPglobal算法是代价很高的 -假设所有的频繁模式预先计算好 -每一步都要找到所有最优的代表模式 减少限制:RPlocal算法 -每一步找到局部代表模式 -直接从原始数据中挖掘 -利用频繁模式挖掘算法生成过程中模式的内在关系的特征(模式挖掘算法大多是depth-first,从空模式开始,不断的模式增长扩展模式集) RPlocal算法 RPlocal算法 探测模式(probe pattern) P P的子节点 覆盖P的已被访问过的模式 条件集(conditional set) 出现在当前模式的项集 todo-set 基于当前模式被扩展的项 done-set 所有其他项 eg.搜索空间5个项a,b,c,d,e 当前模式{a,c},则条件集是(a,c), todo-set是(d,e), done-set是(b) 深度优先搜索每个模式被访问两次: 1.从其父节点的访问 2.扫描完其子节点后回溯 所有可能覆盖它的模式 在第二次访问完成后都 已列举。即任一模式仅 被其子节点和已被访问 过的模式覆盖 局部策略的原则 局部算法与全局算法区别在于探测模式的选取 注:当探测模式选为当前最大集,则等同于全局模式 Global Greedy Local Greedy 找每一个模式 Pr (未被覆盖) 探测模式(Probe Patt

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档