- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
天津理工大学实验报告
学院(系)名称:计算机与通信工程学院
姓名 学号 专业 班级 实验项目 聚类分析、主成分分析与因子分析 课程名称 数据分析及其应用软件 课程代码 0665106 实验时间 2016年4月13号3、4节,中午 实验地点 7号楼216 批改意见 成绩
教师签字: 一.系统聚类分析:
实验
掌握系统聚类分析的基本思想,并能够对分析结果进行解释。
实验
实验过程记录
(1)在spss中录入数据。
(2)打开系统聚类对话框,选择参与系统聚类分析的变量
(3)选择聚类方法,并按下图勾选相应项。
(4)选定凝聚状态表及冰柱图(谱系图)。
(5)点击“继续”,便会得到凝聚状态表和树状图。
实验结果及分析。
凝聚状态表:
谱系图:
结果分析:
实验所用数据中参与聚类分析的对象分为三类比较合适,如下表:第三类地区企业盈利属于高水平,第一类地区企业盈利属于中等水平,第二类地区企业盈利属于低水平。
类别
地区
地区个数
第一类
北京,天津,上海,甘肃,青海,海南,贵州,山西,重庆,黑龙江,新疆,宁夏
12
第二类
广西,云南,四川,江西,陕西,吉林,安徽,内蒙古
8
第三类
山东,湖南,福建,湖北,江苏,广东,河北,河南,辽宁,浙江
10
二.K-均值聚类分析:
1. 实验
掌握K-均值聚类分析的基本思想,并能够对分析结果进行解释。
2. 实验
实验过程记录。
(1)沿用上面的数据,并对变量差异较大的原始数据进行标准化。
打开K均值聚类分析的对话框,将所有标准化后的变量选入变量框里,地区作为个案标注依据;
点击迭代按钮,选择迭代次数为10,点击保存按钮并勾选聚类成员;
点击选项按钮并勾选初始聚类中心和anova表,最后点击OK按钮。
4. 实验结果及分析。
初始聚类中心
聚类
1
2
3
Zscore(企业个数)
.02881
-1.19197
2.45457
Zscore(盈利个数)
.04567
-1.21582
2.39791
Zscore(净利润)
-.11133
-.58671
1.42907
Zscore(营业收入)
-.34695
-.44782
2.10744
Zscore(增加值率)
1.90731
-1.08753
-.95640
Zscore(全员劳动生产率)
-.54389
2.74311
.14202
聚类中心的选择原则是聚核点距离其他点尽可能远。
迭代历史记录a
迭代
聚类中心中的变动
1
2
3
1
1.656
1.417
1.584
2
.588
.000
.965
3
.124
.000
.180
4
.000
.000
.000
最终聚类中心
聚类
1
2
3
Zscore(企业个数)
-.38144
-1.09240
.97617
Zscore(盈利个数)
-.37598
-1.09455
.96753
Zscore(净利润)
-.58152
-.41480
1.11302
Zscore(营业收入)
-.61849
-.50521
1.20300
Zscore(增加值率)
.31160
-.82668
-.28172
Zscore(全员劳动生产率)
-.60570
1.37105
.61837
ANOVA
聚类
误差
F
显著性
均方
自由度
均方
自由度
Zscore(企业个数)
7.791
2
.497
27
15.679
.000
Zscore(盈利个数)
7.679
2
.505
27
15.199
.000
Zscore(净利润)
9.327
2
.383
27
24.337
.000
Zscore(营业收入)
10.870
2
.269
27
40.432
.000
Zscore(增加值率)
2.247
2
.908
27
2.476
.103
Zscore(全员劳动生产率)
7.850
2
.493
27
15.936
.000
实验
2、对表中数据选取适当的指标做主成分分析。对以上数据进行主成分分析,选择变量为得分、篮板、助攻、抢断、盖帽、失误、投篮命中率、罚球命中率和效率值9个变量。
相关性矩阵
得分
篮板
助攻
抢断
盖帽
失误
投篮命中率
罚球命中率
效率值
相关性
得分
1.000
-.023
.171
.370
-.198
.523
-.181
.310
.684
篮板
-.023
1.000
-.405
-.163
.739
-.125
.6
文档评论(0)