SPSS在数据挖掘中的应用参考.ppt

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS在数据挖掘中的应用参考

第16章 SPSS在数据挖掘中的应用 16.1 实例提出:168信息点播业务 数据16-1.sav是某月陕西主要地区各类业务的流量数据,数据16-2.sav是该月每天各类业务的流量数据。请利用这些资料分析以下问题: 问题一:请分析在168信息点播服务方面陕西各地区(西安、宝鸡、咸阳等)总流量的差别。 问题二:请指出该月点播业务最好三项栏目,并分析它们之间的流量有无显著性差异。 问题三:请预测该月点播业务最好栏目的长期发展趋势。 16.2 实例的SPSS软件操作详解 问题一操作详解 问题一要求分析在168信息点播服务方面陕西各地区(西安、宝鸡、咸阳等)总流量的差别。由于各地区在股票点播、指数点播等业务上的流量数据差异较大,并没有统一的大小顺序关系,因此可以采用聚类分析研究陕西各地区的总流量差异。 问题一操作详解 Step01:打开数据文件及对话框 打开数据文件16-1sav,选择菜单栏中的【Analyze(分析)】→【Classify(分类)】→【Hierarchical Cluster(系统聚类)】命令,弹出【Hierarchical Cluster Cluster Analysis(系统聚类分析)】对话框。 Step02:选择聚类分析变量 在左侧的候选变量列表框中选择西安、宝鸡、榆林等十个地区变量设定为聚类分析变量,将其添加至【Variables(变量)】列表框中。同时点选【Variable(变量)】单选钮,表示选择聚类对象为指标变量。 Step03:输出聚类数目 在主对话框中单击【Statistics】按钮,弹出相应对话框。点选【Single solution(单一方案)】单选钮,并在【Number of clusters(聚类数)】文本框中键入数字“3”表示利用聚类分析将十个地区分为三类。其他选项保持系统默认,单击【Continue】按钮返回主对话框。 问题一操作详解 Step04:输出聚类图 在主对话框中单击【Plots】按钮,弹出【Plots(绘制)】对话框。勾选【Dendrogram(树状图)】复选框,表示输出样品的聚类树形图。其他选项保持系统默认,单击【Continue】按钮返回主对话框。 Step05:聚类方法选择 在主对话框中单击【Method】按钮,弹出【Method(方法)】对话框。在【Transform Values(转换值)】选项组的【Standardize】下拉菜单中选择【Z scores(Z得分)】标准化方法。其他选项保持系统默认,单击【Continue按】钮返回主对话框。 Step06:单击【OK】按钮,完成操作。 问题一操作详解 问题二操作详解 Step01:计算各项业务的日平均流量 打开数据文件16-2.sav,选择菜单栏中的【Analyze(分析)】 →【Compare Means(比较均值)】→【Means(均值)】命令,弹出【Means(均值)】对话框。在左侧的候选变量列表框中选择“股票点播”、“指数点播”等业务。其他选项保持系统默认,单击【OK】按钮完成操作。 接着根据输出的业务流量统计数据表16-2.sav,可以确定日平均流量最大的三项业务“股票点播”、“每日运程”和“劲爆笑话”为点播业务最大的业务。 问题二操作详解 问题二操作详解 Step02:业务流量的差异性研究 选择菜单栏中的【Analyze(分析)】 →【Nonparametric Tests(非参数检验)】→【Legacy Dialogs(旧对话框)】→【K Related Samples(K个相关样本)】命令,弹出【Tests for Sevearl Related Samples(多个关联样本检验)】对话框。在候选变量列表框中同时选择“股票点播”、“每日运程”和“劲爆笑话”变量作为配对检验变量,将其同时添加至【Test Variable(s)(检验变量)】列表框中。在【Test Type(检验类型)】选项组中勾选【Friedman】复选框作为配对样本检验的方法。最后单击主对话框中的【OK】按钮,完成操作。 问题二操作详解 问题三操作详解 Step01:绘制序列图 打开数据文件16-2.sav,选择菜单栏中的【Analyze(分析)】 →【Forecasting(预测)】→【Sequence Charts(序列图)】命令,弹出【Sequence Charts(序列图)】对话框。在左侧的候选变量列表框中选择“股票点播”进入右侧的【Variables(变量)】列表框。其他选项保持系

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档