主成分,聚类,因子程序.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
天津理工大学实验报告 学院(系)名称:计算机与通信工程学院 姓名 学号 专业 班级 实验项目 聚类分析、主成分分析与因子分析 课程名称 数据分析及其应用软件 课程代码 0665106 实验时间 2016年4月13号3、4节,中午 实验地点 7号楼216 批改意见 成绩 教师签字: 一.系统聚类分析: 实验 掌握系统聚类分析的基本思想,并能够对分析结果进行解释。 实验 实验过程记录 (1)在spss中录入数据。 (2)打开系统聚类对话框,选择参与系统聚类分析的变量 (3)选择聚类方法,并按下图勾选相应项。 (4)选定凝聚状态表及冰柱图(谱系图)。 (5)点击“继续”,便会得到凝聚状态表和树状图。 实验结果及分析。 凝聚状态表: 谱系图: 结果分析: 实验所用数据中参与聚类分析的对象分为三类比较合适,如下表:第三类地区企业盈利属于高水平,第一类地区企业盈利属于中等水平,第二类地区企业盈利属于低水平。 类别 地区 地区个数 第一类 北京,天津,上海,甘肃,青海,海南,贵州,山西,重庆,黑龙江,新疆,宁夏 12 第二类 广西,云南,四川,江西,陕西,吉林,安徽,内蒙古 8 第三类 山东,湖南,福建,湖北,江苏,广东,河北,河南,辽宁,浙江 10 二.K-均值聚类分析: 1. 实验 掌握K-均值聚类分析的基本思想,并能够对分析结果进行解释。 2. 实验 实验过程记录。 (1)沿用上面的数据,并对变量差异较大的原始数据进行标准化。 打开K均值聚类分析的对话框,将所有标准化后的变量选入变量框里,地区作为个案标注依据; 点击迭代按钮,选择迭代次数为10,点击保存按钮并勾选聚类成员; 点击选项按钮并勾选初始聚类中心和anova表,最后点击OK按钮。 4. 实验结果及分析。 初始聚类中心 聚类 1 2 3 Zscore(企业个数) .02881 -1.19197 2.45457 Zscore(盈利个数) .04567 -1.21582 2.39791 Zscore(净利润) -.11133 -.58671 1.42907 Zscore(营业收入) -.34695 -.44782 2.10744 Zscore(增加值率) 1.90731 -1.08753 -.95640 Zscore(全员劳动生产率) -.54389 2.74311 .14202 聚类中心的选择原则是聚核点距离其他点尽可能远。 迭代历史记录a 迭代 聚类中心中的变动 1 2 3 1 1.656 1.417 1.584 2 .588 .000 .965 3 .124 .000 .180 4 .000 .000 .000 最终聚类中心 聚类 1 2 3 Zscore(企业个数) -.38144 -1.09240 .97617 Zscore(盈利个数) -.37598 -1.09455 .96753 Zscore(净利润) -.58152 -.41480 1.11302 Zscore(营业收入) -.61849 -.50521 1.20300 Zscore(增加值率) .31160 -.82668 -.28172 Zscore(全员劳动生产率) -.60570 1.37105 .61837 ANOVA 聚类 误差 F 显著性 均方 自由度 均方 自由度 Zscore(企业个数) 7.791 2 .497 27 15.679 .000 Zscore(盈利个数) 7.679 2 .505 27 15.199 .000 Zscore(净利润) 9.327 2 .383 27 24.337 .000 Zscore(营业收入) 10.870 2 .269 27 40.432 .000 Zscore(增加值率) 2.247 2 .908 27 2.476 .103 Zscore(全员劳动生产率) 7.850 2 .493 27 15.936 .000 实验 2、对表中数据选取适当的指标做主成分分析。对以上数据进行主成分分析,选择变量为得分、篮板、助攻、抢断、盖帽、失误、投篮命中率、罚球命中率和效率值9个变量。 相关性矩阵 得分 篮板 助攻 抢断 盖帽 失误 投篮命中率 罚球命中率 效率值 相关性 得分 1.000 -.023 .171 .370 -.198 .523 -.181 .310 .684 篮板 -.023 1.000 -.405 -.163 .739 -.125 .6

文档评论(0)

w447750 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档