R软件及编程应用第十讲概述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R软件及编程应用 中南财经政法大学信息与安全工程学院 刘树栋 第十讲、多元统计分析 1、主成分分析与因子分析 2、判别分析 3、聚类分析 4、典型相关分析 5、对应分析 总体概况 多元统计分析(Multivariable Statistical Analysis)也称多变量统计 分析、多因素统计分析或多元分析, 是研究客观事物中多变量(多因素或多标)之间的相互关系和多样品对象之间差异以及以多个变量为代表的多元随机变量之间的依赖和差异的现代统计分析理论和方法。 主成分分析与因子分析的目的是寻找多个变量的“代表”, 判别分析能将对象分类到已知类别中, 聚类分析按照一定的尺度把对象分类, 典型相关分析研究两组变量之间的相关问题,对应分析探究行列变量的关系。 1、主成分分析与因子分析 主成分分析(Principle Component Analysis)是把多维空间的相关多变量的数据集, 通过降维化简为少量而且相互独立的新综合指标, 同时又使简化。后的新综合指标尽可能多的包括原指标群中的主要信息, 或是尽可能不损失原有指标的主要信息的一种多元统计分析方法。 因子分析(Factor Analysis)最早于1904年由英国著名统计学家、心理学家查尔斯·皮尔逊(Chales.S.Pearson)提出, 主要目的是研究相关矩阵的内在依赖关系, 把多个显在的变量综合为少数几个不可观测的“潜在因子”或称公共因子, 来说明复杂多变量系统的内部结构, 并解释原始显在复杂多变量与少数“潜在因子”之间的内在联系和相关关系. 然后, 根据专业知识和定性分析对综合因子所反映的独特含义进行命名和解释的一种多元统计分析方法。 2、主成分分析与因子分析的区别 (1)因子分析需要构造因子模型, 是把原观测变量表现为公共因子(新综合因子)与特殊因子的有机组合模型. 而主成分分析不能作为一个模型来描述, 只能作为通常的变量变换, 也就是把新综合变量表现为原多变量的线性变换(组合)。 (2)在理论上主成分分析中的综合主分量数m和原变量的个数p之间是相等的, 它是把一组具有相关性的变量变换为一组新的独立变量。而因子分析的目的是要求构造的因子模型中公共因子的数目尽可能少, 以便尽可能构造一个结构简单的模型。 2、主成分分析与因子分析的区别 (3)因子分析是把原观测变量表示为新综合因子的线性组合, 即新因子的综合指标, 而主成分分析是把主分量表示为原观测变量的线性组合。另外,因子分析模型在形式上与线性回归模型相似, 但两者之间有本质的区别:回归模型中的自变量是可观测的, 而因子模型中各个公共因子是不可观测的潜在因子, 而且两个模型的参数意义上很不相同。 (4)主成分分析的数学模型实质上是一种变换, 而因子分析模型是描述原指标X协差阵Σ结构的一种模型。 (3)因子分析是把原观测变量表示为新综合因子的线性组合, 即新因子的综合指标, 而主成分分析是把主分量表示为原观测变量的线性组合。另外,因子分析模型在形式上与线性回归模型相似, 但两者之间有本质的区别:回归模型中的自变量是可观测的, 而因子模型中各个公共因子是不可观测的潜在因子, 而且两个模型的参数意义上很不相同。 (4)主成分分析的数学模型实质上是一种变换, 而因子分析模型是描述原指标X协差阵Σ结构的一种模型。 (5)在主成分分析中每个主成分相应的系数是唯一确定的, 而在因子分析中每个因子的相应系数不是唯一的, 即因子载荷阵不是唯一 3、R的实现命令 (1)主成分的R函数 利用R语言的princomp()函数就可完成主成分分析, princomp()的定义形式如下: 参数说明: formula是没有响应变量的公式; x是用于主成分分析的数据;cor是逻辑变量,当cor=TRUE表示用样本的相关阵R作主成分分析, 否则当cor=FALSE(默认选项)表示用样本的协方差阵S作主成分。 应用实例: (学生身体4项指标的主成分分析) 随机抽取30名某年级中学生,测量其身高(X1)、体重(X2)、胸围(X3)、坐高(X4), 数据如下表所示, 试对这30名学生身体四项指标作主成分分析。 实现过程: 结果分析(1)Standard deviation: 表示主成分的标准差, 即主成分方差平方根, 即相应特征值的开方; Proportion of Variance: 表示方差的贡献率; Cumulative Proportion: 表示方差的累计贡献率;(2)用sum mary函数中loadings=TRUE选项列出了主成分对应原始变量的系数, 因此得到前两个主成分是Y1 = 0.497x1+0.543x2 + 0.450x3 +0.506x4;Y2 =0.515x1 + 0.210x2 + 0.462x3 +0

文档评论(0)

119220 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档