- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关联规则分析(association analysis) 例3.1 (Groceries.txt) 这是一个超市购物例子(Hahsler et al., 2006),数据中有9835笔交易,涉及169种商品。每个交易为一个顾客的购买记录,而每种商品是一个二分变量,比如,购买用1代表,未购买用0代表。通过对数据的初步计算,我们发现在单项计数中,全牛奶(whole milk)的频数最高,为2513(频率接近26%),而其次为:其它蔬菜(other vegetables)为1903,面包(rolls/buns)为1809,苏打(soda)为1715,酸奶(yogurt)为1372等等。超过5%的顾客购买的商品频率显示在图3.1中。此外,还可以知道分别买不同数量商品的顾客人数,购买1至9种商品的人数展示在下表中:超市例子 library(arules)data(Groceries)summary(Groceries)itemFrequencyPlot(Groceries, support = 0.05, cex.names = 0.8) #图3.1超过5%的顾客购买的商品名字和频率 术语每一个观测称为一个事务或交易(transaction)每一个二分变量称为一个项目或项(item)事务数据集、项目集或项集(itemset)用X表示一个项目或者项目集,用Y表示与X没有交的另一个项目或项目集,那么记号“X=Y”表示X和Y同时出现的一个规则(rule)在X=Y中,称X为前项(也称为条件项或左项,antecedent, left-hand-side or LHS of the rule),而称Y为后项(也称为结果项或右项,consequent,right-hand-side or RHS of the rule)。X=Y的支持度(support) X=Y的置信度(confidence) X=Y的提升(lift) 信息 记s(Z)表示事务Z在包含N个事务的整个事务数据集中的频数,用A表示事务包含X的事件,而B表示事务包含Y的事件(X和Y没有交) ,则: library(arules)data(Groceries)summary(Groceries)itemFrequencyPlot(Groceries, support = 0.05, cex.names = 0.8) #图3.1fsets - eclat(Groceries, parameter = list(support = 0.05,maxlen=10))#求频繁项集inspect(fsets[1:10])inspect(sort(fsets, by = support)[1:10])rules = apriori(Groceries, parameter = list(support = 0.01,confidence = 0.01))#求规则x=subset(rules, subset = rhs %in% whole milk lift 1.2)inspect(sort(x, by = support)[1:5]) #第三章表inspect(sort(x, by = confidence)[1:5])#第三章表#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = lhs %in% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5])#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = lhs %ain% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5])#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = rhs %ain% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5])#inspect(sort(x, by = lift)[1:5])x=subset(rules, subset = lhs %pin% whole milk lift 1.2)inspect(sort(x, by = support)[1:5])inspect(sort(x, by = confidence)[1:5
您可能关注的文档
- 公共管理导修(浙大MPA).ppt
- 公共基础课程标准(饭店英语) -.doc
- 公共经济学-2.doc
- 公共卫生抽样技术.ppt
- 公共形象艺术(课件).ppt
- 公开课《圆柱的认识》.ppt
- 公开课教案电力拖动.pptx
- 公理语义-Mann子目标Hoare.ppt
- 公路改造工程施组.doc
- 公路工程质检监理抽检用表.doc
- 2025机器人智能解決方案賦能表面精加工白皮书.docx
- 2025ABB AquaMaster4电磁流量计插入式传感器.docx
- 2025 ABB FlexPendant产品使用手册指南.docx
- 2025 ABB IRB 920产品手册指南.pdf
- 2025基于Web of Science和CNKI的可视化分析.docx
- 河北省唐山2025届一模政治试题及答案.docx
- 我的“开顶陶俑”--七年级生涯规划主题心理班会.docx
- 2025秋九上道德与法治第一课第二节《走向共同富裕》教学设计、教案、核心素养目标、教学反思.docx
- 香港工联会2025港岛历史文化深度游发展策略研究报告繁体版49页.pdf
- Navan2023年商务旅行和消费的新现实-当前差旅热点话题英文版14页.pdf
最近下载
- 申请英国签证在职证明中英文版.docx VIP
- L5 BladeEditor模块功能介绍.pdf VIP
- 工业建筑设计规范.docx VIP
- 《深入探讨教育公平问题》课件.ppt VIP
- 水闸工程管理设计规范(SL170-96).pdf VIP
- 上海市徐汇区2022-2023学年八年级下学期期末数学试题.docx VIP
- ISO 17637-2016 Non-destructive testing of welds – Visual testing of fusion-welded joints-en-中文版目视无损检测.pdf VIP
- 海底捞《新员工岗前培训手册》.pdf VIP
- 上海市徐汇区2024-2025学年下学期八年级期末考试数学试题(含部分答案).pdf VIP
- 化工园区安环一体化管理平台建设方案.ppt VIP
文档评论(0)