关联规则分析.pptx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联规则分析(association analysis) 例3.1 (Groceries.txt) 这是一个超市购物例子(Hahsler et al., 2006),数据中有9835笔交易,涉及169种商品。每个交易为一个顾客的购买记录,而每种商品是一个二分变量,比如,购买用1代表,未购买用0代表。通过对数据的初步计算,我们发现在单项计数中,全牛奶(whole milk)的频数最高,为2513(频率接近26%),而其次为:其它蔬菜(other vegetables)为1903,面包(rolls/buns)为1809,苏打(soda)为1715,酸奶(yogurt)为1372等等。超过5%的顾客购买的商品频率显示在图3.1中。此外,还可以知道分别买不同数量商品的顾客人数,购买1至9种商品的人数展示在下表中:超市例子 library(arules)data(Groceries)summary(Groceries)itemFrequencyPlot(Groceries, support = 0.05, cex.names = 0.8) #图3.1超过5%的顾客购买的商品名字和频率 术语每一个观测称为一个事务或交易(transaction)每一个二分变量称为一个项目或项(item)事务数据集、项目集或项集(itemset)用X表示一个项目或者项目集,用Y表示与X没有交的另一个项目或项目集,那么记号“X=Y”表示X和Y同时出现的一个规则(rule)在X=Y中,称X为前项(也称为条件项或左项,antecedent, left-hand-side or LHS of the rule),而称Y为后项(也称为结果项或右项,consequent,right-hand-side or RHS of the rule)。X=Y的支持度(support) X=Y的置信度(confidence) X=Y的提升(lift) 信息 记s(Z)表示事务Z在包含N个事务的整个事务数据集中的频数,用A表示事务包含X的事件,而B表示事务包含Y的事件(X和Y没有交) ,则: library(arules)data(Groceries)summary(Groceries)itemFrequencyPlot(Groceries, support = 0.05, cex.names = 0.8) #图3.1fsets - eclat(Groceries, parameter = list(support = 0.05,maxlen=10))#求频繁项集inspect(fsets[1:10])inspect(sort(fsets, by = support)[1:10])rules = apriori(Groceries, parameter = list(support = 0.01,confidence = 0.01))#求规则x=subset(rules, subset = rhs %in% whole milk lift 1.2)inspect(sort(x, by = support)[1:5]) #第三章表inspect(sort(x, by = confidence)[1:5])#第三章表#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = lhs %in% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5])#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = lhs %ain% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5])#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = rhs %ain% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5])#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = lhs %pin% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5

文档评论(0)

骨干 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档