第九章 主成分分析第九章 成分分析第九章 主成分分析第九章 主成分分析.ppt

第九章 主成分分析第九章 成分分析第九章 主成分分析第九章 主成分分析.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二主成分 中的 应在 的条件下,使 达到最大 等价于各综合指标间互不相关 第三主成分 中的 应在, 的条件下,使 达到最大。 主成分定义 称线性组合 为 x1, x2,…, xp 的第 j 个主成分 其系数向量 应满足如下条件: 1、正则条件: 2、正交条件: 3、最大方差条件: 使 达到最大 4、主成分的方差依次递减: 由定义可知,要确定 m 个主成分实际上就是要确定 m 个 p 维向量 引 理 设A是n 阶对称阵, 其特征根为 , 对应的单位化特征向量为 则 且当 时,二次型 达到上确界。 求 法 由引理可知,求主成分便是求相关系数矩阵 R 的特征根及对应的单位化特征向量。 主成分在几何图形中的方向就是 R 的特征向量的方向 问 题 引入主成分的目的是为了减少指标的个数,那么 m 取多大? 样本主成分y1, y2,…, yp的协方差阵为Λ 性质1 性质2 由性质1和性质2可知, p个主成分所反映的数据总差异等于原指标所反映的数据总差异。 协方差矩阵Λ的对角线上的元素之和等于特征根之和 贡献率和累计贡献率 为第 j 个主成分 yj 的贡献率 为前m个主成分y1 , y2,…,ym的累计贡献率 选取m的标准: 根据问题的性质和要求,可选取 m 使累计贡献率达到70%~90%。即只要用前 m 个主成分就可以基本反映个体间的差异,从而达到减少指标的目的。 主成分的表述形式 若从原p个指标提取了m个主成分,则 第 j 个主成分 第 i 个分量(第 i 个原指标) 如何对主成分作出解释? 这里借助于原指标 xj 关于主成分y1, y2,…, ym 的回归作某些解释。 xj 关于y1, y2,…, ym 的回归方程 性质3 回归系数 回归平方和 残差平方和 复相关系数 贡献率和负荷量 m 个主成分y1, y2,…,ym对指标 xj 的贡献率。 反映了 m 个主成分所能反映指标 xj 差异的比例。 贡献率: 负荷量: 在主成分 yi 上指标 xj 的负荷量; 原指标 xj 与主成分yi 的相关系数; 反映了原指标 xj 与主成分 yi 的关系的密切程度,它为对主成分的解释提供了一定的依据。 主成分分析需要注意的主要问题 原始数据大部分变量的相关系数较大,主成分分析会取得较好效果 基于相关系数矩阵还是基于协方差矩阵做主成分分析 没有定论,建议都试一下,分析结果的差别及发生明显差异的原因何在 一般而言,当分析中所选择的变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。否则,基于协方差阵做主成分分析效果更好。 选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。 如何解释主成分所包含的经济意义。 应 用 聚类分析 判别分析 回归分析 先根据累计贡献率选择主成分的个数,进行主成分分析,得 到因子得分,即得到每个样品的主成分值,然后再做相应的 统计分析 主成分回归 所谓主成分回归是根据累计贡献率的要求,选p个自变量的m个主成分,然后建立因变量y关于这m个主成分的回归方程。 例9.1 数据(法国的进口总额的相关数据) 序号(年份) x1 (国内生产总值) x2 (存储量) x3 (总消费量) y (进口总额) 1(1949) 149.3 4.2 108.1 15.9 2(1950) 161.2 4.1 114.8 16.4 3(1951) 171.5 3.1 123.2 19.0 4(1952) 175.5 3.1 126.9 19.1 5(1953) 180.8 1.1 132.1 18.8 6(1954) 190.7 2.2 137.7 20.4 7(1955) 202.1 2.1 146.0 22.7 8(1956) 212.4 5.6 154.1 26.5 9(1957) 226.1 5.0 162.3 28.1 10(1958) 231.9 5.1 164.3 27.6 11(1960) 239.0 0.7 167.6 26.3 主成分回归的主要步骤 计算相关阵:Correlate-Bivariate 观察是否存在多重共线性现象(变量之间相关系数较高),若存在,则进行主成分分析 根

您可能关注的文档

文档评论(0)

cxiongxchunj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档