网站大量收购独家精品文档,联系QQ:2885784924

多元统计分析——基于R-语言-PPT课件-主成分分析.pptxVIP

多元统计分析——基于R-语言-PPT课件-主成分分析.pptx

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

多元统计分析中国人民大学:何晓群苏州大学:马学俊——基于R语言

主成分分析学习目标:1.理解主成分分析的基本理论与方法;2.了解主成分的性质;3.理解主成分的求解方法;4.掌握用R软件求解主成分的方法;5.正确理解软件输出结果并对结果进行分析05

5.1主成分分析的基本原理主成分分析主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息。

5.1主成分分析的基本原理5.1.1主成分分析的基本思想思想: 通过对原始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线性组合形成几个综合指标(主成分),可以在保留原始变量主要信息的前提下起到降维与简化问题的作用主成分与原始变量之间有如下基本关系: ①每一个主成分都是各原始变量的线性组合; ②主成分的数目大大少于原始变量的数目; ③主成分保留了原始变量的绝大多数信息; ④各主成分之间互不相关

5.1主成分分析的基本原理5.1.2主成分分析的基本理论???

5.1主成分分析的基本原理5.1.2主成分分析的基本理论??

5.1主成分分析的基本原理念5.1.3主成分分析的几何意义??

5.2总体主成分及其性质本节导论?

5.2.1从协方差矩阵出发求解主成分结论5.2总体主成分及其性质引论?

5.2.1从协方差矩阵出发求解主成分结论5.2总体主成分及其性质?结论

5.2.2主成分的性质5.2总体主成分及其性质定义5.1??

5.2.2主成分的性质5.2总体主成分及其性质定义5.2?因子负荷量是主成分解释中非常重要的解释依据,因子负荷量的绝对值大小刻画了该主成分的主要意义及其成因;因子负荷量与系数向量成正比。

5.2.2主成分的性质5.2总体主成分及其性质定义5.3??

5.2.2主成分的性质性质15.2总体主成分及其性质性质2性质3性质4性质5?????

5.2.3从相关矩阵出发求解主成分5.2总体主成分及其性质?

5.2.4由相关阵求主成分时主成分性质的简单形式性质5.2总体主成分及其性质?

5.3样本主成分的导出符号定义?

5.3样本主成分的导出由相关阵R求解主成分?

5.3样本主成分的导出由相关阵R求解主成分?

5.4有关问题的讨论5.4.1关于由协方差矩阵或相关矩阵出发求解主成分1.相同之处2.如何选择求主成分的过程是一致的,实际就是对矩阵结构进行分析的过程,也就是求解特征根的过程。对于度量单位不同的指标或取值范围彼此差异非常大的指标,不直接由其协方差矩阵出发进行主成分分析而应该考虑将数据标准化对同度量或取值范围在同量级的数据,直接从协方差矩阵求解主成分为宜。对于从什么出发求解主成分,现在还没有一个定论,要考虑实际情况

5.4有关问题的讨论5.4.2主成分分析不要求数据来自正态总体与很多多元统计方法不同,主成分分析不要求数据来自正态总体主成分分析的这一特性大大扩展了其应用范围,对多维数据,只要是涉及降维的处理我们都可以尝试用主成分分析而不用花太多精力考虑其分布情况。

5.4有关问题的讨论5.4.3主成分分析与重叠信息?

5.5主成分分析步骤及框图5.5.1主成分分析步骤step1:根据研究问题选取初始分析变量;step2:根据初始变量特性判断由协方差阵求主成分还是由相关阵求主成分;step3:求协方差阵或相关阵的特征根与相应标准特征向量;step4:判断是否存在明显的多重共线性,若存在,则回到第①步;step5:得到主成分的表达式并确定主成分个数,选取主成分;step6:结合主成分对研究问题进行分析并深入研究。

5.6主成分分析的上机实现【例5-1】为掌握我国各地区主要行业的城镇私营企业就业人员的平均工资水平,选取2016年我国30个省、直辖市、自治区(西藏地区数据缺失)9个行业就业人员的平均工资数据(数据来源于2017年《中国统计年鉴》)。我们用主成分分析方法处理该数据,以期用较少的变量描述这些行业各地区就业人员的工资水平。本例中各变量的量纲差别不大,为了保留各变量自身的变异,选择从协方差阵出发求解主成分。主要分为以下三步:Step1:读入数据,计算特征值Step2:计算特征向量和因子负荷量Step3:第3步:进一步分析主成分的选择

5.6主成分分析的上机实现Step1:读入数据,计算特征值,输入如下:1.rm(list=ls())2.?ex5.1?-?read.table(例5-1.txt,?head=TRUE,?file

您可能关注的文档

文档评论(0)

xinhezil + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体衢州市衢江区星赫电子商务商行
IP属地浙江
统一社会信用代码/组织机构代码
92330803MA7BB9H7X8

1亿VIP精品文档

相关文档