数据挖掘原理、_算法及应用第3章_关联规则挖掘教材教学课件.ppt

数据挖掘原理、_算法及应用第3章_关联规则挖掘教材教学课件.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教学课件讲义PPT教学教案培训资料医学中小学上课资料

  2. 挖掘量化关联规则   量化关联规则是多维关联规则,其中在挖掘过程中数值属性动态离散化,以满足某种挖掘标准,如最大化所挖掘的规则的置信度或紧凑性。如何挖掘左部有两个量化属性,右部有一个分类属性的量化关联规则, 即  Aquan1∧Aquan2Acat      其中,Aquan1和Aquan2对量化属性的区间(其中区间动态地确定)测试,Acat测试任务相关数据的分类属性。这种规则称做2维量化关联规则,因为它们包含两个量化维。例如,假定 关心像顾客的年龄和收入这样的量化属性对顾客喜欢买的电视机类型(如高分辨率电视,即HTV)之间的关联关系, 如下所示即是这种2-D量化关联规则的一个例子: (Age(X, “30…39”) ∧income(X, “42k…48k”)buys(X, “HDTV”) (3.8)   该方法将量化属性映射到满足给定分类属性条件的2-D元组栅格上,然后,搜索栅格发现点簇,由此产生关联规则。 3.8 相 关 分 析 3.8.1 强关联规则不一定有趣的例子   规则是否有趣可以主观或客观地评估。最终,只有用户能够确定规则是否有趣,并且这种判断是主观的, 因用户而异。然而,根据数据“背后”的统计,客观兴趣度度量可以用于清除无趣的规则,而不向用户提供。 (1) k=0; (2) FOR all frequent closed itemsets c∈FC{ (3) L‖c‖= L‖c‖∪{c}; //按项的个数归类 (4) IF(k‖c‖)THEN k=‖c‖; //记下项目集包含的最多的个数 (5) } (6) FOR(i=k;il;i--) (7) FOR all itemsets c∈Li (8) FOR all(i-1) subsets s of c //分解所有(i-1)项目集 (9) IF(s Li-1)THEN{ //不包含在Li-1中 (10) s.support=c.support; //支持度不变 (11) Li-1=Li-1∪{s}; //添加到Li-1中 (12) } (13) L=∪Li; //返回所有的Li   Close算法最终需要通过频繁闭合项目集得到频繁项目集。 首先对FC中的每个闭合项目集计算它的项目个数, 把所有项目个数相同的归入相应的Li中。例如,闭合项目集{AB}, 它的个数为2,则把它加入L2中。依此类推,将所有闭合项目集分配到相应的Li中,同时得到最大的个数记为k。然后从k开始,对每个Li中的所有项目集进行分解,找到它的所有的(i-1)项子集。对于每个子集,如果它不属于Li-1,则把它加入Li-1,直到i=2,就找到了所有的频繁项目集。   为了能直观地了解Close算法的思想和具体技术, 下面给出一个应用的实例。   【例3.6】示例数据库如表3-6所示,然后跟踪算法的执行过程(其中最小支持度为2)。    (1) 计算FCC1各个产生式的闭合集和支持度。   首先得到FCC1的产生式:FCC1的产生式为{A}、 {B}、 {C}、 {D)、 {E}。然后计算闭合集。   例如,计算{A}的闭合。数据库中第一项{ABE}包含{A},这时{A}的闭合首先得到{ABE};第四 项{ABD}包含{A}, 所以取{ABD}和{ABE}的交集{AB}作为{A}的闭合集;第五项{AC}包含{A},则取{AB}和{AC}的交集得到{A}作为{A}的闭合集;第7项是{AC},交集为{A};第8项{ABCE} 与{A}的交集是{A};第9项{ABC}与{A}的交集是{A}。这时到了最后一项,计算完成,得到{A} 的闭合是{A},并同时计算出{A}的支持度为6(可通过对出现的A的超集进行计数得到)。同样可以得到FCC1所有的闭合集与支持度(见表3-7)。 表3-6 用于Close算法的示例数据库 TID Itemset TID Itemset 1 A B C 6 B C 2 B D 7 A C 3 B C 8 A B C E 4 A B D 9 A B C 5 A C 表3-7 示例数据库中FCC1所有的闭合集与支持数 Generator Closure Support {A} {A} 6 {B} {B} 7 {C} {C} 6 {D} {BD} 2 {E} {ABE} 2   (2) 进行修剪。    将支持度小于最小支持度的候选闭合项删除,得到FC1。 本例得到的FC1与FCC1相同。   (3) 利用FCl的Generator生成FCC2。    

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档