- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析和聚类分析剖析
北京建筑工程学院
理学院 信息与计算科学专业 实验报告
课程名称 《数据分析》 实验名称《主成分分析和聚类分析》 实验地点: 基础楼C-423日期__2016.5.5_____ 姓名 张丽芝 班级 信131 学号 201307010108___ 指导教师 王恒友 成 绩
【实验目的】 (1)熟悉利用主成分分析进行数据分析,能够使用SPSS软件完成数据的主成分分析;
(2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用SPSS软件完成该任务。
【实验要求】
根据各个题目的具体要求,分别运用SPSS软件完成实验任务。
【实验内容】
1、表4.9(数据见exercise4_5.txt)给出了1991年我国30个省市、城镇居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人)
X1: 人均粮食支出; X2:人均副食支出;
X3: 人均烟酒茶支出; X4: 人均其他副食支出;
X5:人均衣着商品支出; X6: 人均日用品支出;
X7: 人均燃料支出; X8: 人均非商品支出。
(1)求样本相关系数矩阵R。
(2)从R出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率;
2、(1)对题1中的数据,按照原有的八个指标,对30个省份进行聚类,给出分为3类的聚类结果。
(2)利用题1得到的前2个主成分指标,分别按最短距离法(最近邻居距离)、最长距离法(最远邻居距离)、类平均距离法(组间平均距离)、重心距离法;其中距离均采用欧式平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为3类的聚类结果。并与(1)的结果进行比较
【实验步骤】(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)
1
1)
相关矩阵 V2 V3 V4 V5 V6 V7 V8 V9 相关 V2 1.000 .334 -.055 -.061 -.289 .199 .349 .319 V3 .334 1.000 -.023 .399 -.156 .711 .414 .835 V4 -.055 -.023 1.000 .533 .497 .033 -.139 -.258 V5 -.061 .399 .533 1.000 .698 .468 -.171 .313 V6 -.289 -.156 .497 .698 1.000 .280 -.208 -.081 V7 .199 .711 .033 .468 .280 1.000 .417 .702 V8 .349 .414 -.139 -.171 -.208 .417 1.000 .399 V9 .319 .835 -.258 .313 -.081 .702 .399 1.000
2)
表:方差贡献率和累计贡献率
解释的总方差 成份 初始特征值 提取平方和载入 旋转平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 3.096 38.704 38.704 3.096 38.704 38.704 3.079 38.485 38.485 2 2.367 29.590 68.294 2.367 29.590 68.294 2.385 29.809 68.294 3 .920 11.500 79.794 4 .706 8.824 88.618 5 .498 6.231 94.848 6 .230 2.874 97.722 7 .131 1.635 99.357 8 .051 .643 100.000 提取方法:主成份分析。 由上图可知, 只有前两个成分的特征值大于1,所以只选择前两个主成分。第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。
最终聚类中心 聚类 1 2 3 V2 8.79 8.48 10.38 V3 47.05 31.14 70.37 V4 8.82 7.07 6.76 V5 12.80 9.14 16.73 V6 16.96 16.31 17.29 V7 12.80 10.21 18.56 V8 1.88 1.78 3.09 V9 13.63 11.51 24.20 2
每个聚类中的案例数 聚类 1 10.00
您可能关注的文档
- 主体分部工程剖析分部分项剖析.doc
- 主体明挖围护桩施工方案9.03剖析.doc
- 主体结顶轻质墙体等施工方案剖析.doc
- 主体施工阶段施工现场临时用电组织设计剖析.docx
- 主副水仓作业规程剖析.doc
- 主体考试题剖析.doc
- 主动电极并发症及预防_于波剖析.ppt
- 为理想而奋斗剖析.ppt
- 临汾_东方泰华门项目_整体定位及开发策略剖析.ppt
- 为新中国而奋斗(2010-11-15)仝华剖析.ppt
- 2025AACR十大热门靶点推荐和解读报告52页.docx
- 财务部管理报表.xlsx
- 高中物理新人教版选修3-1课件第二章恒定电流第7节闭合电路欧姆定律.ppt
- 第三单元知识梳理(课件)-三年级语文下册单元复习(部编版).pptx
- 俄罗斯知识点训练课件-七年级地理下学期人教版(2024).pptx
- 课外古诗词诵读龟虽寿-八年级语文上学期课内课件(统编版).pptx
- 高三语文二轮复习课件第七部分实用类文本阅读7.2.1.ppt
- 高考物理人教版一轮复习课件第4章第3讲圆周运动.ppt
- 高考英语一轮复习课件53Lifeinthefuture.ppt
- 2025-2030衣柜行业风险投资发展分析及投资融资策略研究报告.docx
文档评论(0)