主成分分析和聚类分析剖析.docVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析和聚类分析剖析

北京建筑工程学院 理学院 信息与计算科学专业 实验报告 课程名称 《数据分析》 实验名称《主成分分析和聚类分析》 实验地点: 基础楼C-423日期__2016.5.5_____ 姓名 张丽芝 班级 信131 学号 201307010108___ 指导教师 王恒友 成 绩 【实验目的】 (1)熟悉利用主成分分析进行数据分析,能够使用SPSS软件完成数据的主成分分析; (2)熟悉利用聚类分析进行数据分析,能够运用主成分分析的结果,做进一步分析,如聚类分析、回归分析等,能够使用SPSS软件完成该任务。 【实验要求】 根据各个题目的具体要求,分别运用SPSS软件完成实验任务。 【实验内容】 1、表4.9(数据见exercise4_5.txt)给出了1991年我国30个省市、城镇居民的月平均消费数据,所考察的八个指标如下:(单位均为元/人) X1: 人均粮食支出; X2:人均副食支出; X3: 人均烟酒茶支出; X4: 人均其他副食支出; X5:人均衣着商品支出; X6: 人均日用品支出; X7: 人均燃料支出; X8: 人均非商品支出。 (1)求样本相关系数矩阵R。 (2)从R出发做主成分分析,求出各主成分的贡献率及前两个主成分的累积贡献率; 2、(1)对题1中的数据,按照原有的八个指标,对30个省份进行聚类,给出分为3类的聚类结果。 (2)利用题1得到的前2个主成分指标,分别按最短距离法(最近邻居距离)、最长距离法(最远邻居距离)、类平均距离法(组间平均距离)、重心距离法;其中距离均采用欧式平方距离,对样本进行谱系聚类分析,并画出谱系聚类图;给出分为3类的聚类结果。并与(1)的结果进行比较 【实验步骤】(此部分主要包括实验过程、方法、结果、对结果的分析、结论等) 1 1) 相关矩阵 V2 V3 V4 V5 V6 V7 V8 V9 相关 V2 1.000 .334 -.055 -.061 -.289 .199 .349 .319 V3 .334 1.000 -.023 .399 -.156 .711 .414 .835 V4 -.055 -.023 1.000 .533 .497 .033 -.139 -.258 V5 -.061 .399 .533 1.000 .698 .468 -.171 .313 V6 -.289 -.156 .497 .698 1.000 .280 -.208 -.081 V7 .199 .711 .033 .468 .280 1.000 .417 .702 V8 .349 .414 -.139 -.171 -.208 .417 1.000 .399 V9 .319 .835 -.258 .313 -.081 .702 .399 1.000 2) 表:方差贡献率和累计贡献率 解释的总方差 成份 初始特征值 提取平方和载入 旋转平方和载入 合计 方差的 % 累积 % 合计 方差的 % 累积 % 合计 方差的 % 累积 % 1 3.096 38.704 38.704 3.096 38.704 38.704 3.079 38.485 38.485 2 2.367 29.590 68.294 2.367 29.590 68.294 2.385 29.809 68.294 3 .920 11.500 79.794 4 .706 8.824 88.618 5 .498 6.231 94.848 6 .230 2.874 97.722 7 .131 1.635 99.357 8 .051 .643 100.000 提取方法:主成份分析。 由上图可知, 只有前两个成分的特征值大于1,所以只选择前两个主成分。第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。 最终聚类中心 聚类 1 2 3 V2 8.79 8.48 10.38 V3 47.05 31.14 70.37 V4 8.82 7.07 6.76 V5 12.80 9.14 16.73 V6 16.96 16.31 17.29 V7 12.80 10.21 18.56 V8 1.88 1.78 3.09 V9 13.63 11.51 24.20 2 每个聚类中的案例数 聚类 1 10.00

文档评论(0)

586334000 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档