第四章用SPSS工具做数据挖掘.pptVIP

下载本文档

12
0
约2.64千字
约 25页
2017-06-26 发布于北京
举报
版权申诉

第四章用SPSS工具做数据挖掘.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

SPSS Clementine功能 SPSS Clementine操作界面本示例的数据文件保存为GOODS1n，我们向数据流程区添加Var. File结点，并将数据文件读入该结点。向数据流增加一个Derive结点，将该结点命名为Increse。在公式栏中输入(After - Before) / Before * 100.0以此来计算促销前后销售额的变化。添加一个Type结点到数据流中。由于在制定促销方案前我们并不知道促销后商品的销售额，所以将字段After的Direction属性设置为None；神经网络模型需要一个输出，这里我们将Increase字段的Direction设置为Out，除此之外的其它结点全设置为In。在设置好各个字段的Direction方向后我们将Neural Net结点连接入数据流。在对Neural Net进行设置时我们选择快速建模方法（Quick），选中Prevent overtraining防止过度训练。同时我们还可以根据自己的需要设置训练停止的条件。将Increase结果结点连接在数据流中的Type结点后。向数据流中增加Derive结点并将它命名为ratio，然后将它连接到Increase结果结点。设置该结点属性，将增添的字段的值设置为(abs(Increase - $N-Increase) /Increase) * 100，其中$N-Increase是由神经网络生成的预测结果。通过该字段值的显示我们可以看出预测值与实际值之间的差异大小。可以通过观察预测值与实际值之间的差异来评价模型的优劣。从Graph栏中选择histogram结点连接到ratio结点。设置该结点，使其输出显示ratio的值（在field的下拉列表中选择ratio），输出结果如下图所示：预测模型建立该模型的建立就是为了预测新样本。我们现将数据源的文件改为GOODS2n；然后按住alt键双击Increase结点以此来绕过该结点；断开Increase结果结点与Ratio结点之间的连接，再增添一个Table结点观察Increase结果结点的输出。在Type结点中我们只设置字段after的Direction属性为None，其余的都为In。通过这种方法建立好的数据流如下图所示：右键单击Table结点，选择运行数据流。运行生成的结果如下，其中$N-Increase为预测结果输出规范化 $N-Increase栏表示促销后销售额可能增减的比率。由于神经网络的最终输出需要规范到[0,1]区间，所以我们选择输出值在(0,1)内连续的S形函数将结果规范化。S型函数表达式为。我们通过增加Derive结点将结果其规范化。选择促销方案: 根据神经网络模型的预测输出，我们可以选出GOODS2n文件中包含的可执行促销方案。假定预测结果经规范化后结值1的方案为可执行方案，我们需要增加一个结点来选出满足这些条件的结点。Clementine为我们提供了Select结点，它可以从数据集中筛选出满足预定条件的记录,从Record OPs栏内选择Select结点连接到Format结点后，在它的属性设置中选择包含format＝1.000的结点，整个流程图如右图所示：运行数据流后我们将得到可用于促销的方案。结果图如下所示： * 谢谢！ * SPSS数据挖掘二零一三年五月目录二、 SPSS工具介绍三、数据挖掘模型CRISP方法一、数据挖掘介绍四、 SPSS工具数据挖掘（神经网络）什么是数据挖掘通过采用自动或半自动的手段，在海量数据中发现有意义的行为和规则的探测和分析活动。数据挖掘是一门科学，有科学的方法和模型作为基础数据挖掘又是一门艺术，需要使用者对商业问题的深入理解和模型适用条件深刻的认识数据挖掘的商业思路更好的数据挖掘结果 ! 知识商业问题 ? 行业经验数据挖掘的技术思路 ? ! 商业问题解决方案数据挖掘问题商业问题目录二、 SPSS工具介绍三、数据挖掘CRISP方法一、数据挖掘介绍四、 SPSS工具数据挖掘（神经网络）建立客户档案并且计算出客户保持率。探查并预测公司中的欺诈行为。确定和预测网站数据中有价值的访问顺序。预测销售和增长的未来趋势。描述直邮的回应和信用风险。对流失进行预测，分类和分割。详细审查自动产生的大量数据，并发现有用模式。数据流程区选项面板管理器项目区报告窗口状态窗口目录二、 SPSS工具介绍三、数据挖掘CRISP方法一、数据挖掘介绍四、 SPSS工具数据挖掘（神经网络） CRISP-DM介绍跨行业数

您可能关注的文档

文档评论（0）

0520 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

第四章用SPSS工具做数据挖掘.pptVIP