实验1 spss软件熟悉和关联规则挖掘.doc

下载文档 降价啦

2915
0
约 24页
2016-04-30 发布于天津
举报
版权申诉
保障服务

实验1 spss软件熟悉和关联规则挖掘.doc

1、本文档共24页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

按照教学大纲内容，实验设计按照章节内容依次展开，如下所示：实验1 SPSS软件熟悉和关联规则挖掘实验主题：应用关联规则模型提高超市销量商业案例：如何摆放超市的商品引导消费者购物从而提高销量，对大型连锁超市来说是一个现实的营销问题。关联规则模型可以在海量数据中依据该模型的独特算法发现数据内在的规律性联系，进而提供具有洞察力的分析解决方案。本次实验通过一则超市销售商品的案例，实验任务：熟悉IBM SPSS Modeler软件的基本操作、基本概念；利用软件提供的Apriori算法对购物篮数据集进行关联规则挖掘，数据集为Demos文件夹下的 BASKETS1n；总结实验过程，完成实验报告。实验方式：课上讲解、展示基本操作，助教指导学生上机完成实验。启动Clementine；双击“源”中“可变文件”；右键加入的“可变文件”，选择“编辑”，单击“…”选择要导入的文件（如，Demos文件夹下BASKETSln）；单击“确定”即可。第二步：理解数据了解数据集中有那些字段，字段的分布，字段间隐含的某种相关性。可以通过添加“类型”节点到数据流。双击“类型”节点，就能详细地了解该数据集中的数据。第三步：准备数据把暂时没有用到的字段剔除。做法：选中“类型”，通过“方向”列中的选项设定。第四步：建模模型一：“Apriori” 将“建模”中的“Apriori”模型节点加入到数据流中。右键单击“Apriori”节点，选择“执行”，此时，在右侧管理器窗口“模型”中就会生成一个模型。右键单击该模型，选择“浏览” 。查看结果：模型二：“GRI” 在数据流上增加“GRI”模型，步骤同“Apriori”模型。但是对于市场购物篮数据分析，得到的结果不同（比Apriori模型多了一种商品——frozenmeal）。说明，数据挖掘中，模型的不同，得到的结果也可能不同。 “Apriori”模型和“GRI”模型都属于定量分型方法；下面给出一种定性分析方法。步骤三：定性分析方法：“网络” 前面两个模型是采用定量的分析，下面采用一种定性的分析——“网络”。双击“网络”节点，将“网络”节点加入到数据流中。对网络节点进行设置。同“类型”节点的做法一样，对与挖掘无关的字段进行剔除。右键单击“网络”，选择“执行”。拖动游标，可得到不同关联强度的字段关联规则。数据流图：运行结果：实验2利用SPSS软件进行分类建模实验主题：应用 SPSS 商业案例：实验任务：利用IBM SPSS Modeler软件提供的，建立模型完成实验报告。实验方式：课上讲解、展示基本操作，助教指导学生上机完成实验。第二步：查看导入数据第三步：添加新的属性增加一个属性health，并设定同时购买鱼和水果顾客的健康属性为T，否则为F。第四步：设定节点类型，属性的流入流出方向。第五步：添加C5.0节点，并生成生成树查看结果。第六步：增加C&RT节点增加CART算法决策树，并查看结果。实验3 利用SPSS软件进行聚类分析实验主题：应用SPSS帮助电信运营商细分用户商业案例：目前电信运营商面临着激烈的市场竞争。对电信运营商来说，客户即生命，如何保持现有客户是企业客户管理的重中之重。用户细分后，企业管理者可以根据不同客户群体的特征，做出不同的营销策略。实验任务：本次实验利用IBM SPSS Modeler 中提供的k均值聚类方法对用户进行聚类，并对结果进行分析和应用。该次实验数据集需要进行一定预处理。利用数据集建立模型，细分用户后完成实验报告。实验方式：课上讲解、展示基本操作，助教指导学生上机完成实验。打开SPSS软件，选择菜单栏中的【File(文件)】→【Open(打开)】→【Data(数据)】命令，弹出【Open Data(打开数据)】对话框。第二步：选定打开文件类型在【Files of type(文件类型)】下拉列表框中指定打开Excel文件类型。接着，选择iris.xls文件。最后单击【Open(打开)】按钮。第三步：设置变量名称弹出的对话框中的【Read variable names from the fi rst row of date(从第一行数据读取变量名)】复选框表示SPSS将Excel工作表的第一行设定为SPSS的变量名称，【Range(范围)】文本框表示选定Excel文件导入SPSS的数据范围。这里，保持系统默认选项。第四步：完成操作最后，单击【OK(确定)】按钮，数据即可导入成功。此时，SPSS的数据浏览窗口中会出现相关的数据内容。第五步：打开对话框选择菜单栏中的【Analyze（分析）】→【Classify（分类）】→ 【K-Means Cluster（K均值聚类）】命令，弹出【K-Means C