- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析实
在统计学中,主成分分析(principal components analysis, PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大HYPERLINK /wiki/%E6%96%B9%E5%B7%AE \o 方差方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对HYPERLINK /wiki/%E6%96%B9%E5%B7%AE \o 方差方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。
在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为HYPERLINK /wiki/%E5%8F%98%E9%87%8F \o 变量变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的HYPERLINK /wiki/%E7%BB%9F%E8%AE%A1%E6%95%B0%E6%8D%AE \o 统计数据统计数据反映的信息在一定程度上有重叠。在用HYPERLINK /wiki/%E7%BB%9F%E8%AE%A1%E6%96%B9%E6%B3%95 \o 统计方法统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行HYPERLINK /wiki/%E5%AE%9A%E9%87%8F%E5%88%86%E6%9E%90 \o 定量分析定量分析的过程中,涉及的变量较少,得到的HYPERLINK /wiki/%E4%BF%A1%E6%81%AF%E9%87%8F \o 信息量信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具
主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向HYPERLINK /wiki/%E6%A0%B7%E6%9C%AC \o 样本样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
主成分分析的主要作用体现在五个方面,第一,主成分分析能降低所研究的数据空间的维数。第二,可通过因子负荷的结论,弄清X变量间的某些关系。第三,可用于多为数据的一种图形表现方法。第四,可由主成分分析构造回归模型,即把各个主成分作为新自变量代替原来自变量做回归分析。第五,用主成分分析筛选回归变量。
案例分析:
下表是关于全国31个省市的8项经济指标,以此为例,进行主成分分析。
省份
国内生产1
居民消费2
固定资产3
职工工资4
货物周转5
消费价格6
商品零售7
工业产值8
北京1
1394.89
2505
519.01
8144
373.9
117.3
112.6
843.43
天津2
920.11
2720
345.46
6501
342.8
115.2
110.6
582.51
河北3
2849.52
1258
704.87
4839
2033.3
115.2
115.8
1234.85
山西4
1092.48
1250
290.9
4721
717.3
116.9
115.6
697.25
内蒙5
832.88
1387
250.23
4134
781.7
117.5
116.8
419.39
辽宁6
2793.37
2397
387.99
4911
1371.7
116.1
114
1840.55
吉林7
1129.2
1872
320.45
4430
497.4
115.2
114.2
762.47
黑龙江8
2014.53
2334
435.73
4145
824.8
116.1
114.3
1240.37
上海9
2462.57
5343
996.48
9279
207.4
118.7
113
1642.95
江苏10
5155.25
1926
1434.95
5943
1025.5
115.8
114.3
2026.64
浙江11
3524.79
2249
1006.39
6619
754.4
116.6
113.5
916.59
安徽12
2003.58
1254
474
4609
908.3
114.8
112.7
824.14
福建13
2160.52
2320
553.97
5857
609.3
115.2
114.4
433.67
江西14
1205.11
118
文档评论(0)