- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
.专业整理.
.学习帮手.
统计建模与R软件课程报告
对某地区农业生态经济的发展状况作主成分分析
摘 要
主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相关独立或不相关的变量。通常是选出比原始变量个数少,又能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。也就是说,主成分分析实际上是一种降维方法。
关键词:主成分分析 相关矩阵 相关R函数
目 录
TOC \o 1-3 \h \z \u 1 绪论 2
1.1主成分方法简介 2
2总体主成分 2
2.1主成分的定义与导出 2
2.2主成分的性质 3
2.3从相关矩阵出发求主成分 5
2.4相关的R函数 6
3 数据模拟 7
4 结论及对该模型的评价 12
参考文献 12
1 绪论
1.1主成分方法简介
主成分分析(principal component analysis)是将多个指标化为少数几个综合指标的一种统计分析方法,由Pearson(1901)提出,后来被Hotelling(1933)发展了。主成分分析是一种通过降维技术把多个变量化成少数几个主成分的方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的线性组合。
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
2总体主成分
2.1主成分的定义与导出
设Χ是p维随机变量,并假设,。考虑如下线性变换
(2.1)
易见
, (2.2)
, (2.3)
我们希望的方差达到最大,即是约束优化问题
的解。因此,是最大特征值(不妨设为)的特征向量。此时,称为第一主成分。类似地,希望的方差达到最大,并且要求。由于是的特征向量,所以,选择的应与正交。类似于前面的推导,是第二大特征值(不妨设为)的特征向量。称为第二主成分。
一般情况下对于协方差阵,存在正交阵,将它化为对角阵,即
(2.4)
且,则矩阵的第列就对应于,相应的为第主成分。
2.2主成分的性质
关于主成分有如下性质:
(1)主成分的均值和协方差阵。
记
,,
由于
(2.5)
所以有
.
(2)主成分的总方差
由于
所以
或,
其中是协方差阵的第个对角元素。由此可以看出,主成分分析把p个原始变量的总方差分解成了p个不相关变量的方差之和。
称总方差中第主成分的比例为主成分的贡献率。第一主成分的贡献率最大,表明它解释原始变量的能力最强,而的解释能力依次减弱。主成分分析的目的就是为了减少变量的个数,因而一般不会使用所有的p个主成分,忽略一些较小方差的主成分,不会给总方差带来大的影响。称前m个主成分的贡献率之和为主成分的累积贡献率,它表明解释的能力。相对于p,通常取较小的m,使得累积贡献率达到一个较高的百分比(如80%~90%)。此时,可用来代替,达到降维的目的,而信息的损失却不多。
(3)原始变量与主成分之间的相关系数
由式(1.5)知
(2.6)
即
, (2.7)
所以,
, (2.8)
, . (2.9)
在实际应用中,通常只对与的相关系数感兴趣。
(4)个主成分对原始变量的贡献率
前面提到的累积贡献率这个概念度量了个主成分从原始变量中提取信息
原创力文档


文档评论(0)