SPSS分层聚类(R型)实验报告.docVIP

  • 18
  • 0
  • 约1.78千字
  • 约 5页
  • 2019-08-20 发布于江西
  • 举报
青海大学财经学院 实 验 报 告 实验项目名称 SPSS分层聚类(R型) 所属课程名称 SPSS 实 验 类 型 验证型实验 实 验 日 期 2009-12-3 班 级 学 号 姓 名 成 绩 【实验目的及要求】 掌握层次聚类算法的基本思想。 【实验原理】 聚类分析初始时,设各模式自成一类;然后计算类与类之间的距离,选择距离最小的一对合并成一个新类;计算在新产生的类别划分下各类之间的距离,再将距离最近的两类合并;直至所有模式聚成两类为止 。 【实验环境】(使用的软件) spss 18.0等 实验内容: 【实验方案设计】 根据对数据文件data08-04.sav的层次聚类的R型聚类,找出与销售量密切相关的因素及其它相关因素的相关大小。以及其它因素间的关系近似度。 【实验过程】(实验步骤、记录、数据、分析) 操作步骤 1.按Analyze→Calssify→Hierarchical Claster顺序单击菜单项,打开主对话框。 2.选择4个变量:sell、price、ad_rate、sunlight为分析变量,移到Variables栏中。在Cluster栏中选择Variable项。 3.单击Method按钮打开相应对话框。 在Cluster Method栏中选择Furthest neighbor作为聚类方法。 在Measure栏中选择Interval中的Pearson Correlation皮尔逊相关作为测度变量间相似性的方法。 在Transform Values栏Standardize选项中选择None,不进行标准化。 4.单击Plot按钮,打开相应的对话框,选择Dendrogram项,其它使用系统默认值。 5.单击Statistics按钮,打开相应的对话框。选择Proximity matrix,要求显示相关系数矩阵。 6.在主对话框中单击OK按钮执行运算。 【结论】(结果) 表一为综合数据信息表。 表二为变量聚类的相关系数矩阵。可以看出平均日照H(小时)与销售量S(千副)的皮尔逊相关系数达0.973。 表三为聚类的凝聚过程表。第一步是第1个和第4个观测量合并,第二步是第1个和第3观测量合并,第三步是第1个和第2观测量合并。 无论从相关矩阵、聚类的凝聚过程表还是冰柱图、树形图都可以看出销售量和平均日照相关系数最大,首先聚为一类。从整体看,聚为三类是比较好的结果。 【小结】 聚类分析把具有相关度的因素按其相关度大小聚为一类。由于销售量的变化受其它因素的影响,通过聚类分析也可以揭示影响各个因素的影响的大小,以此也找到了对销售量影响最大的因素。 指导教师评语及成绩: 评语: 成绩: 指导教师签名: 批阅日期: 附件一:数据信息 附件二:变量聚类的相关系数矩阵 附件三:聚类的凝聚过程表 附件四:聚为三类的冰柱图 附件五:变量聚类的树形图 表一 数据信息 案例处理摘要a 案例 有效 缺失 合计 N 百分比 N 百分比 N 百分比 12 100.0% 0 .0% 12 100.0% a. 值向量间的相关性 已使用 表二 变量聚类的相关系数矩阵 近似矩阵 案例 矩阵文件输入 销售量S(千副) 平均价格P (英镑) 广告费用E(千英镑) 平均日照H(小时) 销售量S(千副) 1.000 -.922 .964 .973 平均价格P (英镑) -.922 1.000 -.885 -.851 广告费用E(千英镑) .964 -.885 1.000 .923 平均日照H(小时) .973 -.851 .923 1.000 图一 聚为三类的冰柱图 表三 聚类的凝聚过程表 聚类表 阶 群集组合 系数 首次出现阶群集 下一阶 群集 1 群集 2 群集 1 群集 2 1 1 4 .973 0 0 2 2 1 3 .923 1 0 3 3 1 2 -.922 2 0 0 图二 变量聚类的树形图

文档评论(0)

1亿VIP精品文档

相关文档