- 11
- 0
- 约1.67千字
- 约 5页
- 2023-11-20 发布于上海
- 举报
SPSS 聚类分析_详解
SPSS 聚类分析——一个案例演示聚类分析全过程
案例数据源:
有20种12盎司啤酒成分和价格的数据,变量包括啤酒名称、热量、钠含量、酒精含量、价格。数据来自《SPSS forWindows 统计分析》data11-03。点击下载
【一】问题一:选择那些变量进行聚类?——采用“R 型聚类”
1、现在我们有4个变量用来对啤酒分类,是否有必要将 4个变量都纳入作为分类变量呢?热量、钠含量、
酒精含量这3个指标是要通过化验员的辛苦努力来测定,而且还有花费不少成本,如果都纳入分析的话,岂不太麻烦太浪费?所以,有必要对4个变量进行降维处理,这里采用 spssR 型聚类(变量聚类),对4个变量进行降维处理。输出“相似性矩阵”有助于我们理解降维的过程。
2、
2、4个分类变量量纲各自不同,这一次我们先确定用相似性来测度,度量标准选用pearson 系数,聚类方
法选最远元素,此时,涉及到相关,4个变量可不用标准化处理,将来的相似性矩阵里的数字为相关系数。若果有某两个变量的相关系数接近1或-1,说明两个变量可互相替代。
3、只输出“树状图”就可以了,个人觉得冰柱图很复杂,看起来没有树状图清晰明了。从proximitymatrix
表中可以看出热量和酒精含量两个变量相关系数0.903,最大,二者选其一即可,没有必要都作为聚类变量, 导致成本增加。至于热量和酒精含量选择哪一
您可能关注的文档
- pmp试的题目1分析和总结.docx
- PN结特性试验报告.docx
- point atpoint topoint out的用法及区别.docx
- powerdesign中将cdm转化为pdm分析和总结.docx
- PowerHA713配置文档分析和总结.docx
- POWERPOINT 演示文稿分析和总结.docx
- PowerPoint任意调整播放窗口的技巧.docx
- PPM管理系统程序.docx
- PPP项目资金筹措方案 融资方案.docx
- ppr管热熔焊焊接施工工法.docx
- 广西南宁市第二中学2025-2026学年八年级下学期开学收心自测英语试卷(含解析).docx
- 广西南宁市武鸣区武鸣高级中学等校2026年高考模拟信息卷数学试题(含解析).docx
- 广西壮族自治区崇左市江州区2025-2026学年八年级上学期期末语文试题(含解析).docx
- 广西壮族自治区防城港市防城区2025—2026学年八年级上学期期末地理试题(含解析).docx
- 部编版一年级下册语文第五单元培优卷A卷(含答案).docx
- 福建省厦门海沧实验中学2025-2026学年高二上学期期末地理试题(含解析).docx
- 甘肃省天水市甘谷县模范初级中学2025-2026学年九年级数学下学期第一次检测考试试题(含解析).docx
- 甘肃省武威市凉州区爱华育新学校2025-2026学年九年级上学期12月月考英语试题(解析版).docx
- 甘肃张掖市2025--2026学年下学期九年级数学阶段反馈试卷(含解析).docx
- 广东惠州博罗县2025-2026学年九年级上学期阶段诊断历史试卷(含解析).docx
原创力文档

文档评论(0)