网站大量收购独家精品文档,联系QQ:2885784924

SPSSAU_机器学习_apriori关联分析.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

SPSSAU-在线SPSS分析软件

关联规则aprioriSPSSAU

关联规则apriori

Contents

1背景2

2理论3

3操作4

4SPSSAU输出结果4

5文字分析5

6剖析5

Apriori关联规则算法是一种用于数据挖掘的经典算法,其作用是找出数据中频繁出现的集合(频繁

集),进而辅助进行有效决策。比如商场里面购买商品,有1000个人购买了可能1万种商品,那么那些商

品出现频率更高呢,也或者哪两两商品重复出现的频率更高呢。当某两种或者三种商品同时出现,即消费

者更容易同时购买某两种或者三种商品时,此时商场分析人员是否应该考虑将该两种或三种商品摆放在一

起(或者捆绑销售呢),这样可以提供消费者的购物体验满意度,同时也可能带来更高的销售额,也可减

少商品的占用空间等多种好处。这就是Apriori算法的核心应用。此

上述中提及一个关键指标为频繁集,其是指研究项(例子里面为商品名称)及其组合的高频出现情

况,通常情况下有几个指标可以对其进行衡量,分别是支持度,置信度和提升度,该三个指标均是用于衡

量频繁集的指标,但具体意义不完全相同,下述理论部分会进一步说明。

SPSSAU-在线SPSS分析软件

关联规则apriori案例

Contents

1背景2

2理论3

3操作4

4SPSSAU输出结果4

5文字分析5

6剖析5

1背景

Apriori关联规则最为经典的案例是商场商品购物蓝分析,但Apriori关联规则的应用远不于此,其也

在医疗、金融等多个领域得到广泛应用,只要是用于研究类似于数据集一起出现情况,用于挖掘数据潜在

特征组合时均可使用。本案例为某中医疾病探索分析,首先共收集1000名病人的病休特征,每名病人通

常都有多种病状,比如心悸和神经衰弱容易同时出现,失眠与月经不调也容易同时出现等。最终整理出

1000名病人共计3184种病症数据,部分数据如下图所示:

特别提示:

Apriori关联规则分析时,上传到SPSSAU的数据格式较为特殊,比如本案例时共计1000名病人,每

名病人可能有不同的病症,比如上图可以看到,编号为1的病人共有2种病症(分别是消化不良和便

秘),编号为2的病人共有2种病症分别是心性和失眠。最终整理后共计1000名病人共有3184种病症。

数据包括2列,分别是编号和病症情况(如果是比如商场购物,则为订单和具体商品名称)。

上述数据格式是SPSSAU中支持的格式,但很多时候整理的数据格式并非这样,比如很可能是下图所

示的格式,编号为1的病人共有2种病症,该2种病症使用逗号隔开(而不是1种病症1行数据),如果

是类似此类数据,可下载SPSSAU提供的‘apriori_spssau_dataformat_trans.xlsm’这个EXCEL宏文件(有

代码的EXCEL文件)进行处理,一键整理成SPSSAU支持的数据格式。

文件点击就下载,链接为:/apriori_spssau_dataformat_trans.xlsm

SPSSAU-在线SPSS分析软件

关于‘apriori_spssau_dataformat_trans.xlsm’这个EXCEL宏文件(有代码的EXCEL文件)的使用说

明如下:

文件点击就下载,链接为:/apriori_spssau_dataformat_trans.xlsm

首先下载‘apriori_spssau_dataformat_trans.xlsm’这个EXCEL宏文件,如果打开后EXCEL提示有代

码运行则需要同意它。接着将数据A和B列整理好,此时点击‘运行’按钮,并且输入B列涉及的分隔

符(本案例为英文逗号,当然也可以是其它的分隔符号比如斜杠等),即可得到C、D和E共3列数据。C

列标识分隔数量,即比如编号为1的病人共有2种病症,编号为2

文档评论(0)

147****4623 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档