- 1、本文档共127页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;第9章主成分分析;;第9章主要内容;9.1主成分分析的基本思想;9.2总体主成分
9.2.1主成分的含义;二维情形主成分的解释;二维情形主成分的解释(续);利用R程序来模拟这一过程(先下载安装mvtnorm);;;一般,设总体的p个主成分为:
第i个主成分yi的方差为
y1是X的一切线性组合中方差最大者;
y2是与y1不相关是X的一切线性组合中方差最大者;
······;9.2.2主成分的计算;9.2.3主成分的主要性质;载荷与载荷矩阵:;9.2.4主成分个数的确定;9.2.5变量的标准化及意义;9.3样本主成分;9.3.1样本主成分的性质和计算;9.3.2主成分分析的步骤;主成分分析特别说明:;9.3.2(续)主成分相关的R函数;;表6-017个地质勘探点样品的标准化数据;;;第一主成分和第二主成分分别为:
参见教材分析,可将将它们分别理解为“课程差异主成分”和“课程均衡主成分”.;;;;;;表6-017个地质勘探点样品的标准化数据;;;前两个主成分的累积贡献率为0.592+0.228=0.82,已经超过80%,所以只需取两个主成分.第一主成分和第二主成分各为(为简明起见,样本主成分表达式中的所有“*”省略,以下同):;;;;;11号样本点综合排名最高,为17分;7号和9号排名次之,分别为16分和15分;之后样本点得分排名从高到低依次为4、12、3、8和17号.
利用函数biplot来绘制它们在z1和z2构成的坐标面z1Oz2上的散点图,并且加入六个变量在同一坐标面z1Oz2上的载荷散点图,得到所谓的“双坐标”散点图(见图9-9).
借助该图可以对17个勘测样本点进行大致分类:11号样本点独居右上,它在“生油”主成分z1和“储油”主成分z2上得分均高,应该首先重点关注.7、9号样本点相邻且最靠右,且在z1得分很高,可合为一类,次重点考虑;此外,在z1和z2上至少有一个得分较高的3、4、8、12和17号样本点也应该重点考察.这与上面的综合得分和排名一致.;;9.4案例:主成分回归分析;;解(1)先做线性回归分析,R程序及结果如下:
setwd(C:/data)#设定工作路径
c9.1-read.csv(case9.1.csv,header=T)#将数据读入到c9.1中
options(digits=3)#取三位有效数字
lmc9.1-lm(y~1+x1+x2+x3+x4,data=c9.1)
summary(lmc9.1)
从输出结果(见教材)可以看出,回归方程是非常显著的,R2为0.923,模型拟合效果很好,但x1、x2和x3的回归系数没有通过显著性检验(在0.05的显著性水平下).回归方程为:
然后作逐步回归,R程序及结果如下:
summary(step(lmc9.1))
回归方程和回归系数均显著,R2为0.921,逐步回归方程为:;(2)再作主成分回归分析,先求样本相关系数阵:
R=round(cor(c9.1[,2:6]),3);R#求样本相关系数矩阵
发现x4与y高度相关,x1,x2,x3相关性较强,可用主成分降维
c9.1pr-princomp(~x1+x2+x3+x4,data=c9.1,cor=T)#使用公式法
summary(c9.1pr,loadings=T)
前两个主成分累积贡献率已达88%,故选择前两个主成分
pre-predict(c9.1pr)#计算主成分得分
c9.1$z1-pre[,1];c9.1$z2-pre[,2]
lmpr-lm(y~z1+z2,data=c9.1)#做y关于主成分z1和z2的回归
summary(lmpr)
输出结果显示:y关于两个主成分z1和z2的回归方程和三个回归系数均是非常显著的,R2为0.887,主成分回归方程为:
;(3)还利用主成分与原来自变量间的关系将主成分还原为原来的自变量,参见参考文献[4].R程序及结果如下:
beta-coef(lmpr);A-loadings(c9.1pr)[,1:2]
x.bar-c9.1pr$center;x.sd-c9.1pr$scale
coef-A%*%beta[2:3]/x.sd
beta0-beta
您可能关注的文档
- 人工智能营销(第2版)课件 阳翼 第1--5章 迈入人工智能领域---人工智能与定价创新.pptx
- 多元统计分析——基于R(第3版) 课件 费宇 第3、4章 多元正态分布、多元正态总体均值向量和协方差矩阵的假设检验.pptx
- 多元统计分析——基于R(第3版) 课件 费宇 第11、12章-对应分析、 典型相关分析.ppt
- 《项目管理》导入案例答案 刘会福.docx
- 《现代物流运筹学(第二版)》课程标准.doc
- 现代物流运筹学 A卷.doc
- 现代物流运筹学 B卷.doc
- 现代物流运筹学 试卷B.doc
- 现代物流运筹学(A) (2).doc
- 现代物流运筹学(A).doc
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
最近下载
- 第三节 免疫分析仪器的维护_医疗设备维护概论_第四章 医用检验设备的维护.pptx
- 垃圾分类整治工作总结.pptx
- 2024年常见人力资源面试题库(通用7篇).pdf
- 《糟糕,身上长条纹了!》绘本故事PPT2套.pptx
- 25题规划发展岗位常见面试问题含HR问题考察点及参考回答.pdf
- 清华大学央企班组长远程培训自测题及答案(17门课合集).pptx
- 英语国家概况课后习题答案解析(完整版).doc
- 幼儿园 大班数学《美丽的对称图形》.pptx VIP
- 新视野大学英语(第三版)读写教程Section B-Too much of a good thing – A real addiction.ppt
- 2023年中小学教师职称考试试题含答案.docx
文档评论(0)