网站大量收购独家精品文档,联系QQ:2885784924

应用数理统计2011数理统计25主成分分析.ppt

应用数理统计2011数理统计25主成分分析.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章 多元相关(续) 二、因子分析 三、典型相关分析 于是可得第一对样本典型变量为 对应的样本的典型相关系数为 这表 明身高与坐高之和同体重与胸围之差有较大的 依赖关系。 (三)典型变量个数的选取问题 在实际问题中,总体的均值 和 协方差阵 往往未知,应由 与 的样本 来估计. 这时总体均值和协方差阵的估计分别为 若 的秩为 ,非零特征根记为 对应的单位特征向量为 取 则第 对样本典型变量为 第 对样本典型变量的相关系数为 注:在实际应用时, 由于样本资料具有随机误 差, 因此特征值小到什么情况就可以忽略对应 的典型相关变量是一个非常重要的问题. 一般用巴特莱特(Bartlett)大样本(?30)检验法. 典型变量的选取理论上可靠假设检验解决. 若 的秩为 ,非零特征根记为 (1) 检验假设H01: 选取检验统计量 在H01 成立下,当n很大时, Q1近似服从自由度为 pq的卡方分布, H01 不成立Q1有偏大趋势. (2) 检验假设H02: 选取检验统计量 在H02 成立下,当n很大时, Q2近似服从自由度为 (p-1)(q-1)的卡方分布, H02 不成立Q2有偏大趋势. 令 再检验假设H0m: 选取检验统计量 在H0m 成立下,当n很大时, Qm近似服从自由度为 (p-m+1)(q-m+1)的卡方分布, H0m 不成立Qm有偏大 趋势. 令 (3) 一般地,若已检验得 * 冯伟o) wfeng_323@buaa.edu.cn 一、主成分分析 二、因子分析 三、典型相关分析 因子分析法是用尽可能少的不可观测的所谓 的“公共因子”的线性函数与特定因子之和来描 述原来观测的每一分量。其目的是尽可能合理 地解释存在于原始变量之间的相关性,且简化 变量的维数与结构。 (一)因子模型 模型 称为因子模型,其中假设 1. 是可观测的向量,且均 值 协方差阵 等于其相关 矩阵 2. 是不可观测的向 量,其均值 协方差阵是 3. 与 相互独立,且 的协方差阵为对角矩阵 用矩阵可将因子模型表示为 其中 满足前面的三个假设条件, 是 矩阵,即 模型中 叫做公共因子,它们是在各 个原变量的表达式中都共同出现的因子,是相 互独立的不可观测的理论变量。 叫做特殊因子,是原单一变量 (各分量)所特有因子,各特殊因子之间以及特 殊因子与公共因子之间都是相互独立的。 矩阵 的元素 叫做因子载荷,当 的绝 对值大时( )表明 与 的相依程度大,或 说公共因子 对于 的载荷量大,因此称 为 公共因子载荷量,简称因子载荷,而矩阵 称 为因子载荷矩阵。 所谓因子分析,就是如何从一组资料出发, 分析出公共因子与特殊因子来,并求出相应的 (二)因子载荷矩阵的统计意义 载荷矩阵,最后解释各个公共因子的含义。 1. 因子载荷 的统计意义 因为 且 因此 既是 与 协方差, 又是它们的相关系数,即就是说 是用来度量 可用 线性组合表示的 程度,这样称因子载荷 叫做权,表示 与 的依赖程度。 2. 变量共同度的统计意义 称因子载荷矩阵 中各行的平方和 为变量 的共同度。由于 即 上式表明变量 的方差有两部分组成:其一是 它是全部公共因子对于变量 的总方差所 作出的贡献;其二是 它是变量 的特殊因 子所产生的方差,仅与变量 的本身变化有关, 而与公共因子无关,常称为剩余方差。 3. 公共因子 的方差贡献统计意义 将载荷矩阵 的各列元素平方和 称为公共因子 对 的贡献。 (三)因子载荷矩阵的求法 记 称其为约相关矩阵,因为 所以约相关矩阵是非负定的. 从 出发,利用求条件极值的方法,可得 于是 是约相关矩阵R*的最大特征根,而矩阵 A的第一列为对应的特征向量,它还应满足等式 于是 在利用R*的最大特征值所对应的特征 向量b1=(b11,b21,…,bp1)求A时,还需要规格化 再把 作为R*,同样处理,就可得 矩阵A的其余各列,也就求到了矩阵A. 在条件(*)下达到最大,这是一个条件 极值问题。 即有 选取第一公共因子y1,使它的方差贡献 其中 令 典型相关分析是一种研究两个随机向量的 相关关系的统计方法。类似于主成分分析,它 是将两个随机向量的相

文档评论(0)

开心农场 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档