我国城镇民消费支出的主成分分析.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我国城镇民消费支出的主成分分析

2010-2011学年 08级统计学专业学年论文 题目 我国城镇居民消费支出的主成分分析 学生姓名 徐乐 学 号 10801020222 指导教师 陈光蓉 时 间 2011年6月20日 我国城镇居民消费支出的主成分分析 摘要 近年来中国经济发生了翻天覆地的变化,人民的生活水平得到了很大的提高。而消费水平是衡量人民生活水平的重要方面。如何正确认识和评价居民消费水平呢?本文正是以此为出发点,利用主成分分析和聚类分析展开的研究。分析了我国31个地区城市城镇居民生活消费水平的差异 。 关键词 主成分分析 聚类分析 消费水平 1、分析方法简介 1.1 主成分分析 主成分分析的原理。主成分分析是一种把多个变量化为少数几个主成分的统计分析方法。是在保证数据信息丢失最少的情况下,对高维空间进行降维已达到简化分析的目的。这些主成分通常表示为原始变量的某种线形组合。 2应用主成分分析和聚类分析评估各地消费支出 2.1 数据来源 本文数据为各地区域城镇居民家庭平均每人全年消费性支出(2009年),来自《2010年中国统计年鉴》,具体表格见附录。 2.2 主成分分析 (1)计算样本相关系数阵 由于多个变量使用的量纲可能各不相同或者变量间的数值大小相差很大,因此,首先要将初始变量标准化。把全国31个省市作为样本,将食品支出(x1),衣着支出(x2),家庭设备(x3),医疗保健支出(x4),交通通讯(x5),教育文化娱乐支出(x6),居住支出(x7),杂项支出(x8)八项支出作为变量。这样就得到了原始数据,如下表所示: 计算出相关系数阵为: Correlation Matrix X1 X2 X3 X4 X5 X6 Correlation X1 1.000 .252 .742 .297 .883 .828 X2 .252 1.000 .498 .713 .397 .534 X3 .742 .498 1.000 .514 .733 .892 X4 .297 .713 .514 1.000 .433 .569 X5 .883 .397 .733 .433 1.000 .878 X6 .828 .534 .892 .569 .878 1.000 X7 .690 .426 .698 .606 .791 .776 X8 .783 .610 .756 .557 .790 .849 由上表可知各因子之间的相关系数较高,各变量呈较强的线性关系,能够从中提取公因子,适合进行因子分析。 (2)统计检验 KMO and Bartletts Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .827 Bartletts Test of Sphericity Approx. Chi-Square 241.900 df 28 Sig. .000 KMO统计量是相关系数与偏相关系数的一个比值,其值越接近1,作主成分分析越合适。巴特利特球度检验统计量的观测值为241.900,相应的概率接近0。如果显著性水平为0.05,由概率p小于显著水平,应该拒绝零假设,认为相关系数矩阵于单位阵有显著差异。KMO统计量=0.8270.7, p=0.0000.01,所以适合于作主成分分析。Sig.=0.000,小于显著性水平(0.05或0.01),则说明相关系数阵不是单位矩阵,适合于作主成分分析 (3)提取因子 Communalities Initial Extraction X1 1.000 .916 X2 1.000 .854 X3 1.000 .783 X4 1.000 .843 X5 1.000 .892 X6 1.000 .926 X7 1.000 .744 X8 1.000 .835 Extraction Method: Principal Component Analysis. 从输出结果可以看出:前三个主成分的累计方差贡献率已达到90%以上,所以决定用三个新变量代替原来的八个变量。 第一主成分,除x2之外,其余变量的系数都在0.3-0.4附近,说明第一主成分是七个变量的综合,而第二主成分主要反映衣着消费支出的信息,第三主成

文档评论(0)

jiaoyuguanliji + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档