第5章关联分析精选.ppt

第5章关联分析精选

5.6.2 负关联规则   负关联规则作为关联规则的一个分支,指的是两个项集的否定联系,形如A→┐B(项集A的出现会抑制项集B的出现)、┐A→B(项集A不出现会诱导项集B的出现)、┐A→┐B(项集A不出现会抑制项集B的出现)的关联规则。传统的形如A→B的蕴含关系称为正关联规则。   负关联规则挖掘的是项集中的否定联系。   例如,商店中A表示购买茶叶,B表示购买咖啡,则┐A表示不购买茶叶,┐B表示不购买咖啡,规则A→┐B表示顾客购买茶叶时则不会购买咖啡的负关联规则。   假设A、B之间的负关联规则为A→┐B,若它是一个有效的负关联规则,则必须满足以下三个条件: ① A∩B=Φ。 ② support(A)≥min_sup和support(B)≥min_sup。 ③ support(A∪┐B)≥min_sup。 在负关联规则挖掘中,常用的项集支持度计算公式如下: 设        ,常用的规则置信度计算公式如下: 可以通过修改Apriori算法来挖掘负关联规则, 5.7 SQL Server挖掘关联规则的示例 5.7.1 建立DM数据库   采用SQL Server挖掘前面介绍的表5.1事务数据库中关联规则的过程。   首先在SQL Server Management Studio中建立一个DM数据库,建立Assocmaintable和Assocsubtable两个表用于存放事务, Tno Items) 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 Items Ino 1 i1 i2 i5 2 i2 i4 3 i2 i3 4 i1 i2 i4 ┋ ┋ 8 i5 9 i1 i2 i3 Assocsubtable表 Assocmaintable表 5.7.2 建立关联挖掘项目 (1)新建一个Analysis Services项目DM   采用2.6.3小节的步骤定义数据源DM.ds,对应的数据库为前面建立的DM数据库。 (2)建立数据源视图   采用2.6.3小节的步骤定义数据源视图DM.dsv,它包含Assocmaintable和Assocsubtable两个表,并建立两个表之间的关系如图5.29所示。 (3)建立挖掘结构Association.dmm 指定“Microsoft关联规则” 指定表类型 设置挖掘模型结构 “完成向导”页面 “算法参数”页面 5.7.3 部署关联挖掘项目并浏览结果   在解决方案资源管理器中单击“DM”,在出现的下拉菜单中选择“部署”命令,系统开始执行部署,完成后出现部署成功的提示信息。   单击“挖掘结构”下的“Association.dmm”,在出现的下拉菜单中选择“浏览”命令,系统挖掘的关联规则如图5.36所示。 产生的关联规则(1) “项集”选项卡 “依赖关系网络”选项卡 将“最低重要性”改为“-0.04” : 产生的关联规则(2) 再将“最小概率”改为0.7: 产生的关联规则(3) ━━本章完━━ * Exercise: What other frequent patterns come from the CP tree? Exercise: Mine all frequent patterns. * Exercise: What other frequent patterns come from the CP tree? Exercise: Mine all frequent patterns. * Exercise: What other frequent patterns come from the CP tree? Exercise: Mine all frequent patterns. 5.4.2 由FP树产生频繁项集   由FP树产生频繁项集的过程是:由每个长度为1的频繁模式(初始后缀模式)开始,构造它的条件模式基,条件模式基由FP树中与后缀模式一起出现的前缀路径集组成。  然后构造它的(条件)FP树,并递归地在该树上进行挖掘。   这里的一个模式就是一个项集,如FP树中一条从上向下的路径构成模式{i1,i2,i3},{i3}称为它的后缀模式,对于后缀模式α,{i2}∪α称为增长后缀模式。{i1,i2}称为i3的前缀路径。 从索引表中的最后一个项开始。 找到所有包含该项的路径。    ●沿着结点-链接(node-links)。 确定条件模式。  ●路径中符合频度要求的模式。 构建 FP-tree条件基C。 添加项至C中所有路径,生成频繁模式。 递归地挖掘C(添加项)。 从索引表和树中移除项。 挖掘 FP树 i2 7 i1 6 i3 6 i4 2 i5 2 null i2:7 i1:2 i1:4 i3:2 i4

文档评论(0)

1亿VIP精品文档

相关文档