Clementine关联规则实验论文.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Clementine关联规则实验论文

Clementine关联规则 试验目的: 通过使用SPSS Clementine数据挖掘平台,了解数据挖掘的目的、过程,理解数据挖掘的结果,并能够根据所学习的数据挖掘的相关知识,对挖掘的过程参数和结果数据进行分析。 试验内容: 建立数据源,进行关联规则挖掘。 试验步骤: 1、导入数据源 a)选择“可变文件”节点,把节点图标拖入数据流区域 b)右键点击“可变文件”节点,弹出节点细节选择界面 c)导入BASKETS.txt数据 2、查看导入的数据 a)点击节点选项卡“输出”,双击“表格”节点 b)右键点击“BASKETS.txt”节点,选择“Connect”选项,单击“Table”(在两个节点中产生一个箭头,从“BASKETS.txt”指向“Table”节点。) c)右键点击“表格”节点,弹出细节选择界面,单击“执行” d)查看结束,单击“确定”退出查看表格 3、 对数据进行清洗 a)选择节点选项卡的“字段选项”,把“类型”节点拖入数据流区域。 b)连接“BASKETS.txt”节点和“类型”节点 c)双击数据流区域中的“类型”节点,单击“读取值”按钮 d)对值为“T/F”的“方向”改为“两者”,把其他行的“方向”的值改为 “无” 4. 使用Apriori节点分析 a)双击“建模”选项卡的“Apriori”节点 b)连接“类型”节点与“Apriori”节点 (箭头指向“Apriori”节点) c)双击“Apriori”节点,弹出选项界面 d)单击“执行” 按钮 5、查看挖掘结果 a)左键单击管理器的“模型”选项卡,右键点击第5部执行以后出现的模型图标 b)选择“浏览”,弹出图表 c)查看结果 如图可以得到最少置信度百分之八十以上,frozenmeal,cannedveg,beer三者之间支持度的关系,也就是购买者在购买其中之二同时购买其他另外一样东西的关联性大小。 6、提升 a)双击“Apriori”节点,弹出选项界面,修改参数 b)选择“模型”选项卡修改参数 c)修改“最低规则置信度”为50(或者修改“最低条件支持度”和“最大前项数”) d)查看结果 Wine confectionery 下面做关于GRI的生成关联分析 在选择面板中的建模目录中我们选择GRI结点加入到数据流中。执行该数据流,它的结果将在管理器的模型栏中以与模型同名的结点显示,右键选择浏览该结点,如下图所示: 分析结果如下:该结果数据显示了各种商品之间的关系,这个表的每一行表明了购买某种商品的时候还有哪些商品有被购买的可能性,它是基于关联分析中的支持度和置信度来分析的。支持度越大,说明同时被购买的可能性越大。比如我们就第一行来分析,支持度为3.0%,置信度为96.67,顾客在购买cannedveg时有可能会同时购买freshmeat,frozenmeal,beer这三种商品。其他行的相关信息,我们用同样的方法进行分析得出结果。 步骤三:图形化显示各个商品之间的关系我们除了用模型外,还可以用图形目录下的网络结点。选择网络结点将其连入数据流中,此时对网络结点的设置如下: 在plot面板中选择“仅选择真值标志”栏,这可以帮助我们简化输出网络,执行结果如下图所示:其中该图中各色的结点代表了不同种类的商品,任意两点之间连线越策表明这两点之间的关系越强烈,这也正说明购买其中某件商品时,另外一个很有可能也会被同时购买。我们还可以通过改变浮标值设置不同的显示,当浮标值越大时候网络图将显示关系越强烈关系的点。如下图所示: 分析结果如下:就上述网状图,各个节点之间有连线说明两线两端的商品在购买时可能被购买。连线的粗细也表面关系的密切程度,即同时被购买的可能性的大小。在本问题中,我们分析当浮标设置在122时候这种情况,此时购买fish时很大可能会购买fruitveg,购买confectionery时很有可能购买wine,其中cannedveg,beer,frozenmeal这三种商品时因为三者之间存在密切联系,所以购买其中一种时,其他两种被购买的可能性很大。同样,当浮标的值改变时,我们可以用同样的方法来分析数据之间的关系。 因此总的数据流和模型如下 50.174%

文档评论(0)

kakaxi + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档