- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Objectives
Conduct an association analysis and interpret the results ?
Distinguish between association analysis and sequence analysis?
Conduct a sequence analysis and interpret the results.
5.1问题提出
考虑下面的情形,一个商店想对客八数据库进行分析,了解在购物时哪些商品会一起购
买。为此,商店选择了对客户数据库样本进行购物篮分析。 使用的数据集合:SAMPSIO.ASSOCS
ASSOCS中的变量列表
Data Uar iab1es | 1nterua1 Uar i ab1es ] Class Uar iab1es
Name
Mode 1 Ro 1e Measurement
Type
Format
1nformat
CUSTOMER
i nput i nterua1
num
BEST 12 ?
12?
TIME
i nput ord i na1
num
BEST 12 ?
12?
PRODUCT
i nput nomi na1
char
$8?
$8?
数据集合ASSOCS包含了 1001个客户所购买的食品,其屮20种见下表:
Code
Product
apples
Apple
artichok
artichokes
avocado
avocado
baguette
baguettes
Bordeaux
wine
bourbon
bourbon
chicken
chicken
coke
cola
corncd_b
corned beef
cracker
cracker
ham
ham
heineken
beer
herring
fish
ice_crea
icc cream
olives
olives
peppers
peppers
sardines
sardines
soda
soda water
steak
steak
turkey
turkey
10()1个客户中,每个客户均购买了 7个物品,因而总共有7007行。数据集中每一行也 就代表了客户所购产品的一个组合。在大多数数据集合中,并不是所有客户都购买了相同数 量的产品。
创建初始流
按下图样式建立流程图:
Input DataSourceAssoc iat ion
Input Data
Source
Assoc iat ion
a.设置输入数据源(Input Data Source)节点
1打开输入数据源Input Data Source)节点。
2从文件夹SAMPSIO中选择数据集合ASSOCSo
3点击变量(Variables)标签。
4设置变ffl CUSTOMER的模型角色为身份(Id)
5设置变量PRODUCT的模型角色为目标变量(target)。
6设置变量TIME的模型角色序列(sequence) 0
注:变量TIME用于识别购买食品的先后次序。此例屮所有商品均在同时购买,因此在这 儿的次序只表明商晶在购买时的登记先后次序。当考虑这种先后次序时,关联分析就是所谓的序 列分析。
7关闭输入数据源(Input Data Source)节点并保存所做改变。
b .设置关联(Association)节点
8打开关联(Association)节点,按缺省变量(Variables)标签处于活跃状态。查看这一标 签。
Seiected Output 1 Notes
Data Uar i abIes | Genera I | Sequences | T i me Const ra i nts ] Sort ] Output ]
Name
Status
Mode 1 Ro 1e
Measurement
Type
1nformat
Format
CUSTOMER
use
i d
i nterua1
num
12 .
BEST 12 .
TIME
use
sequence
ord i na1
num
12.
BEST 12.
PRODUCT
use
target
nom i na1
char
$8.
$8 ■
9选择综合(General)标签,这个标签可让你调整分析模式和设置所生成的关联规则数量。
Analysis mode:? By Context「
Analysis mode:
? By Context
「hssoc iat ion Sequences
ec 「SpecMax imum number of i tems in an assoc i 曰
ec 「Spec
Max imum number of i tems in an assoc i 曰t i on:
Mini
文档评论(0)