4.第四章_关联规则.pptVIP

  • 4
  • 0
  • 约3.5千字
  • 约 36页
  • 2016-12-06 发布于湖北
  • 举报
例3: * 3、Apriori算法的实现过程 * * 4、由频繁项集产生关联规则 一旦找出频繁项集,再通过最小置信度产生关联规则。 关联规则的产生步骤如下: 对于每个频繁项集l,产生l的所有非空子集。 对于l的每个非空子集s,如果 则输出规则“s→(l-s)”。 * * 以例3为例,看其中一个频繁项集l={I1,I2,I5},可以由l产生哪些关联规则?l的非空子集有{I1,I2}{I1,I5}{I2,I5}{I1}{I2}{I5}。结果关联规则如下,每个都列出了置信度。 如果最小置信度阀值为70%,则只有第2、3和最后一个规则可以输出。 * * 真正可取的规则具备的条件 * 并非所有的规则在符合阀值限制后都是有意义的,这样的规则还分为: 有用的规则:包含高品质的有效情报 常识 无法解释的结果 关联规则真正可取的是具备以下两个条件的规则 : 人们常识之外、意料之外的关联 该规则必须具有潜在的作用 * 5、案例 * * * * * Apriori算法的核心: 用频繁的(k– 1)-项集生成候选的频繁k-项集 用数据库扫描和模式匹配计算候选集的支持度 Apriori的瓶颈:候选集生成 巨大的候选集: 104个频繁1-项集要生成107个候选2-项集 要找尺寸为100的频繁模式,如{a1,a2, …,a100},你必须先产生2100?1030个候选集 多次扫描数据库:

文档评论(0)

1亿VIP精品文档

相关文档