SPSS聚类分析分析和总结.docxVIP

下载本文档

11
0
约1.67千字
约 5页
2023-11-20 发布于上海
举报

SPSS聚类分析分析和总结.docx

SPSS 聚类分析_详解 SPSS 聚类分析——一个案例演示聚类分析全过程案例数据源：有20种12盎司啤酒成分和价格的数据，变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS forWindows 统计分析》data11-03。点击下载【一】问题一：选择那些变量进行聚类？——采用“R 型聚类” 1、现在我们有4个变量用来对啤酒分类，是否有必要将 4个变量都纳入作为分类变量呢？热量、钠含量、酒精含量这3个指标是要通过化验员的辛苦努力来测定，而且还有花费不少成本，如果都纳入分析的话，岂不太麻烦太浪费？所以，有必要对4个变量进行降维处理，这里采用 spssR 型聚类（变量聚类），对4个变量进行降维处理。输出“相似性矩阵”有助于我们理解降维的过程。 2、 2、4个分类变量量纲各自不同，这一次我们先确定用相似性来测度，度量标准选用pearson 系数，聚类方法选最远元素，此时，涉及到相关，4个变量可不用标准化处理，将来的相似性矩阵里的数字为相关系数。若果有某两个变量的相关系数接近1或-1，说明两个变量可互相替代。 3、只输出“树状图”就可以了，个人觉得冰柱图很复杂，看起来没有树状图清晰明了。从proximitymatrix 表中可以看出热量和酒精含量两个变量相关系数0.903，最大，二者选其一即可，没有必要都作为聚类变量，导致成本增加。至于热量和酒精含量选择哪一

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

SPSS聚类分析分析和总结.docxVIP