- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
----宋停云与您分享----
----宋停云与您分享----
统计建模与 R 软件课程报告
对某地区农业生态经济的发展状况作主成分分析
摘 要
主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相关或不相关的变量。通常是选出比原始变量个数少,又能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。也就是说,主成分分析实际上是一种降维方法。
主成分分析 相关矩阵 相关 R 函数
目 录
TOC \o 1-2 \h \z \u 绪论 2
主成分方法简介 2
总体主成分 2
主成分的定义与导出 2
主成分的性质 3
从相关矩阵出发求主成分 5
相关的 R 函数 6
数据模拟 7
结论及对该模型的评价 12
12
----宋停云与您分享----
----宋停云与您分享----
1 绪论
1.1 主成分方法简介
主成分分析(principal component analysis)是将多个指标化为少数几个综合指标的一种统计分析方法,由 Pearson(1901)提出,后来被 Hotelling(1933)发展了。主成分分析是一种通过降维技术把多个变量化成少数几个主成分的方 法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的线性组合。
主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的 因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所 研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息 在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析 问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。
2 总体主成分
主成分的定义与导出
设 Χ 是 p 维随机变量,并假设μ ? ?(X) , Σ ? var(X) 。考虑如下线性变换
----宋停云与您分享----
----宋停云与您分享----
易见
var(Z
i
) ? aT ?a
i i
(2.1)
?Z ? aT X ??11?
?Z ? aT X ?
?
1
1
?Z ? aT X ?
?
?
?
2
2
?
?Z
?
?
? aT X?
p
p
?
cov(Z ,
cov(Z , Z ) ? aT ?a ,
i j i j
i, j ? 1,2, , p, i ? j.
----宋停云与您分享----
----宋停云与您分享----
----宋停云与您分享----
----宋停云与您分享----
我们希望 Z
1
的方差达到最大,即 a
1
是约束优化问题
----宋停云与您分享----
----宋停云与您分享----
max a
max
aT Σa
s.
s.t.
aT a ? 1
----宋停云与您分享----
----宋停云与您分享----
----宋停云与您分享----
----宋停云与您分享----
的解。因此,a
1
是 Σ 最大特征值(不妨设为 ?
1
)的特征向量。此时,称
----宋停云与您分享----
----宋停云与您分享----
Z ? aT X1 1Z2为 第 一 主 成 分 。 类 似 地 , 希 望 的 方 差 达 到 最 大 ,
Z ? aT X
1 1
Z
2
----宋停云与您分享----
----宋停云与您分享----
cov(Z , Z
Σ?21
Σ
?
2
) ? aT Σa
1 2
? 0 。由于a
1
是 ? 的特征向量,所以,选择的a
1 2
应与a
1
正交。
----宋停云与您分享----
----宋停云与您分享----
----宋停云与您分享----
----宋停云与您分享----
a2
a
2
是 第二大特征值(不妨设为
)的特征向量。称
----宋停云与您分享----
----宋停云与您分享----
Z ? aT X 为第二主成分。
2 2
一般情况下对于协方差阵 Σ ,存在正交阵Q ,将它化为对角阵,即
----宋停云与您分享----
----宋停云与您分享----
Q ΣQ ? ? ? ?
Q ΣQ ? ? ? ?
? ?
1
T
?
?
?
? ?
?
?
?
P
?
1 2
? ? ,则矩阵Q 的第i 列就对应于a
p i
,相应的 Z
i
(2.4) 为第i 主成分。
----宋停云与您分享----
----宋停云与您分享----
主成分的性质
关于主成
您可能关注的文档
- 系泊系统的设计问题分析.docx
- 物理建模论文-影响实心球射程的因素讨论.docx
- 维度建模的基本概念及过程.docx
- 投篮问题的数学建模.docx
- 统计专业实验-实验5-平稳时间序列建模.docx
- 统计实训-描述统计.docx
- 统计建模与数据分析实验报告.docx
- 统计建模与R软件实验报告2.docx
- 统计建模与R软件实验报告.docx
- 统计建模与R软件.docx
- 2024年中国弧形减震器市场调查研究报告.docx
- 2024至2030年中国高效全元小麦专用肥数据监测研究报告.docx
- 2024年彩钢岩棉夹芯板项目可行性研究报告.docx
- 2024年多功能蒸汽清洁机项目可行性研究报告.docx
- 2024至2030年大口径IC卡智能水表项目投资价值分析报告.docx
- 2024年中国电动双梁桥式起重机市场调查研究报告.docx
- 2024至2030年中国无水乳清酸行业投资前景及策略咨询研究报告.docx
- 2024年水性彩瓦漆项目可行性研究报告.docx
- 2024年二氧化碳表项目可行性研究报告.docx
- 2024至2030年变速箱装配检测线项目投资价值分析报告.docx
文档评论(0)