- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北京建筑工程学院
理学院 信息与计算科学专业 实验报告
课程名称 《数据分析》 实验名称《主成分分析和聚类分析》 实验地点: 基础楼C-423日期__2016.5.5_____ 姓名 张丽芝 班级 信131 学号 201307010108___ 指导教师 王恒友 成 绩
【实验目的】 (1)熟悉利用主成分分析进行数据分析,能够使用SPSS软件完成数据的主成分分析;
(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用SPSS软件完成该任务。
【实验要求】
根据各个题目的具体要求,分别运用SPSS软件完成实验任务。
【实验内容】
1、表4.9(数据见exercise4_5.txt)给出了1991年我国30个省市、城镇居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人)
X1: 人均粮食支出; X2:人均副食支出;
X3: 人均烟酒茶支出; X4: 人均其他副食支出;
X5:人均衣着商品支出; X6: 人均日用品支出;
X7: 人均燃料支出; X8: 人均非商品支出。
(1)求样本相关系数矩阵R。
(2)从R出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率;
2、(1)对题1中的数据,按照原有的八个指标,对30个省份进行聚类,给出分为3类的聚类结果。
(2)利用题1得到的前2个主成分指标,分别按最短距离法(最近邻居距离)、最长距离法(最远邻居距离)、类平均距离法(组间平均距离)、重心距离法;其中距离均采用欧式平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为3类的聚类结果。并与(1)的结果进行比较
【实验步骤】(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)
1
1)
相关矩阵 V2 V3 V4 V5 V6 V7 V8 V9 相关 V2 1.000 .334 -.055 -.061 -.289 .199 .349 .319 V3 .334 1.000 -.023 .399 -.156 .711 .414 .835 V4 -.055 -.023 1.000 .533 .497 .033 -.139 -.258 V5 -.061 .399 .533 1.000 .698 .468 -.171 .313 V6 -.289 -.156 .497 .698 1.000 .280 -.208 -.081 V7 .199 .711 .033 .468 .280 1.000 .417 .702 V8 .349 .414 -.139 -.171 -.208 .417 1.000 .399 V9 .319 .835 -.258 .313 -.081 .702 .399 1.000
2)
表:方差贡献率和累计贡献率
解释的总方差 成份 初始特征值 提取平方和载入 旋转平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 3.096 38.704 38.704 3.096 38.704 38.704 3.079 38.485 38.485 2 2.367 29.590 68.294 2.367 29.590 68.294 2.385 29.809 68.294 3 .920 11.500 79.794 4 .706 8.824 88.618 5 .498 6.231 94.848 6 .230 2.874 97.722 7 .131 1.635 99.357 8 .051 .643 100.000 提取方法:主成份分析。 由上图可知, 只有前两个成分的特征值大于1,所以只选择前两个主成分。第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。
最终聚类中心 聚类 1 2 3 V2 8.79 8.48 10.38 V3 47.05 31.14 70.37 V4 8.82 7.07 6.76 V5 12.80 9.14 16.73 V6 16.96 16.31 17.29 V7 12.80 10.21 18.56 V8 1.88 1.78 3.09 V9 13.63 11.51 24.20 2
每个聚类中的案例数 聚类 1 10.00
您可能关注的文档
- 无机化工流程题探讨.doc
- 专业技术人员创新与创业能力建设考试真题及探讨.doc
- 无机保温施工方案探讨.doc
- 专业基础知识部分探讨.doc
- 无花果丰产技术探讨.doc
- 专业货代报价相关术语探讨.doc
- 无钩调漂法_图解探讨.doc
- 无功补偿装置安装分项探讨.doc
- 压力容器词汇探讨.doc
- 压力基础知识探讨.doc
- 半导体材料性能提升技术突破与应用案例分析报告.docx
- 半导体设备国产化政策支持下的关键技术突破与应用前景报告.docx
- 剧本杀市场2025年区域扩张策略研究报告.docx
- 剧本杀行业2025人才培训体系构建中的市场需求与供给分析.docx
- 剧本杀行业2025年人才培训行业人才培养模式创新与探索.docx
- 剧本杀行业2025年内容创作人才需求报告.docx
- 剧本杀行业2025年区域市场区域剧本市场消费者满意度与市场竞争力研究报告.docx
- 剧本杀市场2025年区域竞争态势下的区域合作策略分析报告.docx
- 剧本杀行业2025人才培训与行业人才培养模式创新.docx
- 剧本杀行业剧本创作人才心理素质培养报告.docx
文档评论(0)