第5章关联分析精选.ppt

下载文档 降价啦

74
0
约2.37万字
约 147页
2016-12-31 发布于湖北
举报
保障服务

第5章关联分析精选.ppt

第5章关联分析精选

5.6.2 负关联规则　　负关联规则作为关联规则的一个分支，指的是两个项集的否定联系，形如A→┐B（项集A的出现会抑制项集B的出现）、┐A→B（项集A不出现会诱导项集B的出现）、┐A→┐B（项集A不出现会抑制项集B的出现）的关联规则。传统的形如A→B的蕴含关系称为正关联规则。　　负关联规则挖掘的是项集中的否定联系。　　例如，商店中A表示购买茶叶，B表示购买咖啡，则┐A表示不购买茶叶，┐B表示不购买咖啡，规则A→┐B表示顾客购买茶叶时则不会购买咖啡的负关联规则。　　假设A、B之间的负关联规则为A→┐B，若它是一个有效的负关联规则，则必须满足以下三个条件： ① A∩B=Φ。 ② support(A)≥min_sup和support(B)≥min_sup。 ③ support(A∪┐B)≥min_sup。在负关联规则挖掘中，常用的项集支持度计算公式如下：设　　　　　　　　，常用的规则置信度计算公式如下：可以通过修改Apriori算法来挖掘负关联规则， 5.7 SQL Server挖掘关联规则的示例 5.7.1 建立DM数据库　　采用SQL Server挖掘前面介绍的表5.1事务数据库中关联规则的过程。　　首先在SQL Server Management Studio中建立一个DM数据库，建立Assocmaintable和Assocsubtable两个表用于存放事务， Tno Items） 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 Items Ino 1 i1 i2 i5 2 i2 i4 3 i2 i3 4 i1 i2 i4 ┋ ┋ 8 i5 9 i1 i2 i3 Assocsubtable表 Assocmaintable表 5.7.2 建立关联挖掘项目（1）新建一个Analysis Services项目DM 　　采用2.6.3小节的步骤定义数据源DM.ds，对应的数据库为前面建立的DM数据库。（2）建立数据源视图　　采用2.6.3小节的步骤定义数据源视图DM.dsv，它包含Assocmaintable和Assocsubtable两个表，并建立两个表之间的关系如图5.29所示。（3）建立挖掘结构Association.dmm 指定“Microsoft关联规则” 指定表类型设置挖掘模型结构 “完成向导”页面 “算法参数”页面 5.7.3 部署关联挖掘项目并浏览结果　　在解决方案资源管理器中单击“DM”，在出现的下拉菜单中选择“部署”命令，系统开始执行部署，完成后出现部署成功的提示信息。　　单击“挖掘结构”下的“Association.dmm”，在出现的下拉菜单中选择“浏览”命令，系统挖掘的关联规则如图5.36所示。产生的关联规则（1） “项集”选项卡 “依赖关系网络”选项卡将“最低重要性”改为“-0.04” ：产生的关联规则（2）再将“最小概率”改为0.7：产生的关联规则（3） ━━本章完━━ * Exercise: What other frequent patterns come from the CP tree? Exercise: Mine all frequent patterns. * Exercise: What other frequent patterns come from the CP tree? Exercise: Mine all frequent patterns. * Exercise: What other frequent patterns come from the CP tree? Exercise: Mine all frequent patterns. 5.4.2 由FP树产生频繁项集　　由FP树产生频繁项集的过程是：由每个长度为1的频繁模式（初始后缀模式）开始，构造它的条件模式基，条件模式基由FP树中与后缀模式一起出现的前缀路径集组成。　　然后构造它的（条件）FP树，并递归地在该树上进行挖掘。　　这里的一个模式就是一个项集，如FP树中一条从上向下的路径构成模式{i1，i2，i3}，{i3}称为它的后缀模式，对于后缀模式α，{i2}∪α称为增长后缀模式。{i1，i2}称为i3的前缀路径。从索引表中的最后一个项开始。找到所有包含该项的路径。　　 ●沿着结点-链接(node-links)。确定条件模式。　●路径中符合频度要求的模式。构建 FP-tree条件基C。添加项至C中所有路径，生成频繁模式。递归地挖掘C（添加项）。从索引表和树中移除项。挖掘 FP树 i2 7 i1 6 i3 6 i4 2 i5 2 null i2:7 i1:2 i1:4 i3:2 i4

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

第5章关联分析精选.ppt