关联分析购物篮分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Objectives Conduct an association analysis and interpret the results ? Distinguish between association analysis and sequence analysis? Conduct a sequence analysis and interpret the results. 5.1问题提出 考虑下面的情形,一个商店想对客八数据库进行分析,了解在购物时哪些商品会一起购 买。为此,商店选择了对客户数据库样本进行购物篮分析。 使用的数据集合:SAMPSIO.ASSOCS ASSOCS中的变量列表 Data Uar iab1es | 1nterua1 Uar i ab1es ] Class Uar iab1es Name Mode 1 Ro 1e Measurement Type Format 1nformat CUSTOMER i nput i nterua1 num BEST 12 ? 12? TIME i nput ord i na1 num BEST 12 ? 12? PRODUCT i nput nomi na1 char $8? $8? 数据集合ASSOCS包含了 1001个客户所购买的食品,其屮20种见下表: Code Product apples Apple artichok artichokes avocado avocado baguette baguettes Bordeaux wine bourbon bourbon chicken chicken coke cola corncd_b corned beef cracker cracker ham ham heineken beer herring fish ice_crea icc cream olives olives peppers peppers sardines sardines soda soda water steak steak turkey turkey 10()1个客户中,每个客户均购买了 7个物品,因而总共有7007行。数据集中每一行也 就代表了客户所购产品的一个组合。在大多数数据集合中,并不是所有客户都购买了相同数 量的产品。 创建初始流 按下图样式建立流程图: Input DataSourceAssoc iat ion Input Data Source Assoc iat ion a.设置输入数据源(Input Data Source)节点 1打开输入数据源Input Data Source)节点。 2从文件夹SAMPSIO中选择数据集合ASSOCSo 3点击变量(Variables)标签。 4设置变ffl CUSTOMER的模型角色为身份(Id) 5设置变量PRODUCT的模型角色为目标变量(target)。 6设置变量TIME的模型角色序列(sequence) 0 注:变量TIME用于识别购买食品的先后次序。此例屮所有商品均在同时购买,因此在这 儿的次序只表明商晶在购买时的登记先后次序。当考虑这种先后次序时,关联分析就是所谓的序 列分析。 7关闭输入数据源(Input Data Source)节点并保存所做改变。 b .设置关联(Association)节点 8打开关联(Association)节点,按缺省变量(Variables)标签处于活跃状态。查看这一标 签。 Seiected Output 1 Notes Data Uar i abIes | Genera I | Sequences | T i me Const ra i nts ] Sort ] Output ] Name Status Mode 1 Ro 1e Measurement Type 1nformat Format CUSTOMER use i d i nterua1 num 12 . BEST 12 . TIME use sequence ord i na1 num 12. BEST 12. PRODUCT use target nom i na1 char $8. $8 ■ 9选择综合(General)标签,这个标签可让你调整分析模式和设置所生成的关联规则数量。 Analysis mode:? By Context「 Analysis mode: ? By Context 「hssoc iat ion Sequences ec 「SpecMax imum number of i tems in an assoc i 曰 ec 「Spec Max imum number of i tems in an assoc i 曰t i on: Mini

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档