- 40
- 0
- 约9.53千字
- 约 6页
- 2016-12-05 发布于河南
- 举报
多元统计分析聚类(方法步骤分析总结)
K聚类
实验过程
将数据5.7导入至SPSS中,分析-分类-K均值聚类分析,将8个行业放到变量中,地区放到label cases中,设定聚类数=3。
点击“迭代”,设定最大迭代次数为10,迭代标准为0,点击继续
点击“保存”,选择“聚类成员”及“与聚类中心的距离”
点击“选项”,选择如下
点击继续
点击确定后,得到如下实验结果:
实验结果分析:
1. 给出初始的聚类中心
初始聚类中心
聚类
1
2
3
工业
1109.91
2322.56
191.49
建筑业
207.72
181.89
30.13
交通运输仓储和邮政业
263.11
327.67
31.05
批发和零售业
425.29
472.94
35.25
住宿和餐饮业
118.86
94.66
10.50
金融业
543.97
379.71
19.05
房地产业
296.04
380.27
21.32
其他服务业
1448.84
943.69
92.87
2. 给出每次迭代结束后类中心的变动
迭代历史记录a
迭代
聚类中心内的更改
1
2
3
1
583.084
388.520
349.295
2
326.648
.000
58.125
3
103.704
.000
24.548
4
.000
.000
.000
a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 4。初始中心间的最小距离为 1329.460。
从表中可以看出共经历了4次迭代,即4次迭代后,聚类中心的变化为0,迭代停止。
3.给出各观测量所属的类及所属类中心的距离
聚类成员
案例号
地区
聚类
距离
1
北京
1
999.700
2
天津
2
388.520
3
河北
3
255.969
4
山西
3
206.513
5
内蒙古
3
222.286
6
辽宁
3
429.454
7
吉林
3
88.420
8
黑龙江
3
281.144
9
上海
2
388.520
10
江苏
1
287.256
11
浙江
1
205.691
12
安徽
3
137.535
13
福建
3
397.274
14
江西
3
117.827
15
山东
1
414.815
16
河南
3
116.885
17
湖北
3
32.948
18
湖南
3
87.846
19
广东
1
196.590
20
广西
3
166.995
21
海南
3
241.259
22
重庆
3
65.711
23
四川
3
133.945
24
贵州
3
269.408
25
云南
3
179.724
26
西藏
3
391.781
27
陕西
3
36.529
28
甘肃
3
179.022
29
青海
3
68.751
30
宁夏
3
58.378
31
新疆
3
71.101
表中,聚类一列中给出观测量所属的类别,距离列给出了观测量与所属聚类中心的距离。
4.给出聚类结果形成的聚类中心的各变量值。
最终聚类中心
聚类
1
2
3
工业
1165.95
2064.94
428.07
建筑业
143.78
170.58
82.50
交通运输仓储和邮政业
135.89
272.73
73.91
批发和零售业
263.39
445.55
89.18
住宿和餐饮业
61.36
80.96
26.04
金融业
176.16
266.19
28.29
房地产业
152.99
251.86
38.64
其他服务业
559.62
717.59
185.03
综合第三个表及第四个表,可以看出将31个地区按8个产业分成3类后,北京,江苏,浙江,山东,广东为第一类。这一类聚类中心8个产业的产值分别为1165.95,143.78,135.89,263.39,61.36,176.16,152.99,559.62亿元。第二类包括天津和上海,剩下的24个地区为第三类。
5. 聚类中心间的距离
最终聚类中心间的距离
聚类
1
2
3
1
950.808
871.156
2
950.808
1800.646
3
871.156
1800.646
表中给出的是三类聚类中心间的距离
6. 进行单因素方差分析
ANOVA
聚类
误差
F
Sig.
均方
df
均方
df
工业
3258486.158
2
39044.978
28
83.455
.000
建筑业
13391.336
2
949.477
28
14.104
.000
交通运输仓储和邮政业
41058.336
2
1657.82
您可能关注的文档
最近下载
- 浙江省台风年鉴(原始资料).doc VIP
- 《光电图像处理》第五章图像变换及应用.ppt VIP
- 新源县肖尔布拉克镇C波段双偏振天气雷达建设项目环评(新版环评)环境影响报告表.pdf
- 2025年贵州高考物理含解析及答案.docx VIP
- 2025年高考英语一轮复习精品讲义—必修第二册:Unit 2 Let’s celebrate(外研版).pdf VIP
- XR360旋挖钻机技术规格书(修订).docx
- 2025年高考英语一轮复习精品讲义—必修第二册:Unit 3 On the move(外研版).pdf VIP
- 宿迁市2026届高三(一模)英语试卷(含答案).docx
- 2026年10篇稿:领导班子“五个带头”方面在带头强化政治忠诚、提高政治能力等对照检查材料【供参考】.docx VIP
- 2023年青岛城市学院数据科学与大数据技术专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
原创力文档

文档评论(0)