- 10
- 0
- 约1.09万字
- 约 57页
- 2016-12-20 发布于重庆
- 举报
一个约束是简洁的,如果我们可以列出并仅仅列出所有确保满足该约束的集合 利用简洁性约束,我们可以在计数前进行剪枝,从而避免产生-测试方式的过大开销。 E.g. min(J.price) ≥500是简洁的,我们能明确无误的产生满足该约束的所有项集 有些约束不属于前面三类,但是如果项集中的项以特定的次序排列,则对于频繁项集挖掘的全过程,约束可能成为单调的或者是反单调的 例:avg(I.price),既非单调,也非反单调,但是如果事务中的项以价格递增的序添加到项集中,该约束就变成了反单调的 不可转变的约束是数据挖掘中较难处理的部分,但这种约束往往较少。 另外,大部分使用SQL内部聚集的简单SQL表达式都属于前面四类约束 方法4:选样(在给定数据的一个子集挖掘) 基本思想:选择原始数据的一个样本,在这个样本上用Apriori算法挖掘频繁模式 通过牺牲精确度来减少算法开销,为了提高效率,样本大小应该以可以放在内存中为宜,可以适当降低最小支持度来减少遗漏的频繁模式 可以通过一次全局扫描来验证从样本中发现的模式 可以通过第二此全局扫描来找到遗漏的模式 方法5:动态项集计数 在扫描的不同点添加候选项集,这样,如果一个候选项集已经满足最少支持度,则在可以直接将它添加到频繁项集,而不必在这次扫描的以后对比中继续计算。 Apriori算法的主要开销: 可能要产生大量的候选项集 104个频繁1-项集会导致1
您可能关注的文档
最近下载
- 2024-2025学年上海市宝山区五年级(下)期末数学试卷.docx VIP
- GJB 368B-2009 装备维修性通用要求培训课件.pptx VIP
- WDJD-多功能数字直流激电仪说明书.pdf VIP
- 2025年自贡英语中考题及答案.doc VIP
- 2010 年河南省新乡市事业单位考试《公共基础知识》真题( 一 ).docx VIP
- 地理信息系统教程(第二版)全套PPT课件.pptx
- 2024-2025学年上海市普陀区五年级(下)期末数学试卷.docx VIP
- 事业单位招聘_2014年河南省事业单位招聘行测真题.doc VIP
- 智能火灾报警器设计毕业设计论文.pdf VIP
- JGT 579-2021 建筑装配式集成墙面.pdf VIP
原创力文档

文档评论(0)