SPSS聚类分析分析和总结.docxVIP

  • 11
  • 0
  • 约1.67千字
  • 约 5页
  • 2023-11-20 发布于上海
  • 举报
SPSS 聚类分析_详解 SPSS 聚类分析——一个案例演示聚类分析全过程 案例数据源: 有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS forWindows 统计分析》data11-03。点击下载 【一】问题一:选择那些变量进行聚类?——采用“R 型聚类” 1、现在我们有4个变量用来对啤酒分类,是否有必要将 4个变量都纳入作为分类变量呢?热量、钠含量、 酒精含量这3个指标是要通过化验员的辛苦努力来测定,而且还有花费不少成本,如果都纳入分析的话,岂不太麻烦太浪费?所以,有必要对4个变量进行降维处理,这里采用 spssR 型聚类(变量聚类),对4个变量进行降维处理。输出“相似性矩阵”有助于我们理解降维的过程。 2、 2、4个分类变量量纲各自不同,这一次我们先确定用相似性来测度,度量标准选用pearson 系数,聚类方 法选最远元素,此时,涉及到相关,4个变量可不用标准化处理,将来的相似性矩阵里的数字为相关系数。若果有某两个变量的相关系数接近1或-1,说明两个变量可互相替代。 3、只输出“树状图”就可以了,个人觉得冰柱图很复杂,看起来没有树状图清晰明了。从proximitymatrix 表中可以看出热量和酒精含量两个变量相关系数0.903,最大,二者选其一即可,没有必要都作为聚类变量, 导致成本增加。至于热量和酒精含量选择哪一

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档