- 1、本文档共59页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的 这种差异有时很大 实际应用中: 如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑ 采用R代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实意义,便于剖析实际问题,又可以避免突出数值大的变量 一、实际应用中主成分分析的出发点 一、实际应用中主成分分析的出发点 上例化为相关阵出发计算. X的相关矩阵 R的特征值及特征向量为 相应的主成分分别为 的贡献率为 和 累计贡献率为 从R出发的 的贡献率0.705明显小于从Σ出发的Y1的贡献率0.938 原始变量方差之间的差异越大,这一点倾向越明显 可用标准化前的原变量表达如下: 在原变量X1,X2,X3上的载荷相对大小与上例中Yi在X1,X2,X3上的载荷相对大小之间有着非常大的差距 标准化后的结论完全可能会发生很大的变化 二、主成分的合理选择与解释 在主成分分析中,首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,其次对这些被提取的主成分必须都能够给出具有意义的解释 主成分的含义一般多少带点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价 提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊” 如果原始变量之间具有较高的相关性,则前面少数几个主成分的累计贡献率通常就能达到一个较高水平,此时的累计贡献率通常较易得到满足 主成分分析的困难之处在于要如何给出主成分的解释,所提取的主成分中如有一个主成分解释不了,整个主成分分析也就失败了 主成分分析是变量降维的一种重要、常用的方法,但该方法要应用得成功,一是靠原始变量的合理选取,二是靠“运气” 二、主成分的合理选择与解释 例: 在制定服装标准的过程中,对128名成年男子的身材进行了测量,每人测得的指标中含有这样六项:身高(X1)、坐高(X2) 、胸围(X3) 、手臂长(X4) 、肋围(X5)和腰围(X6). 样本相关矩阵列于下表: X1 X2 X3 X4 X5 X6 X1 1.000 X2 0.79 1.000 X3 0.36 0.31 1.000 X4 0.76 0.55 0.35 1.000 X5 0.25 0.17 0.64 0.16 1.000 X6 0.51 0.35 0.58 0.38 0.63 1.000 表:男子身材六项指标的样本相关矩阵 经计算,相关阵 的前三个特征值、相应的特征向量以及贡献率列于下表 表: 的前三个特征值、特征向量以及贡献率 特征向量 :身高 0.469 ?0.365 0.092 :坐高 0.404 ?0.397 0.613 :胸围 0.394 0.397 ?0.279 :手臂长 0.408 ?0.365 ?0.705 :肋围 0.337 0.569 0.164 :腰围 0.427 0.308 0.119 特征值 3.287 1.406 0.459 贡献率 0.548 0.234 0.077 累计贡献率 0.548 0.782 0.859 前三个主成分分别为 前两个主成分的累计贡献率为78.2%,前三个主成分的累计贡献率达85.9%,因此可以考虑只取前面两个或三个主成分,它们能够很好地概括原始变量 第一主成分 对所有(标准化)原始变量都有近似相等的正载荷,故称第一主成分为(身材)大小成分 第二主成分 在 上有中等程度的正载荷,而在 上有中等程度的负载荷,称第二主成分为形状成分(或胖瘦成分) 第三主成分 在 上有大的正载荷,在 上有大的负载荷,而在其余变量上的载荷都较小,可称第三主成分为臂长成分 由于第三主成分的贡献率不高(7.65%)且实际意义也不太重要,因此也可考虑取前两个主成分 三、利用主成分分析进行综合评价 评价指标体系的选择与综合 加权 权重如何选取? 主成分分析能从选定的指标体系中归纳出大部分信息 根据主成分提供的信息进行综合评价 利用主成分进行综合评价是将原有的信息进行综合 权重根据它们的方差贡献率来确定(主成分的信息含量) 三、利用主成分分析进行综合评价 第五节 实例分析与计算机实现 一 主成分分析实例 二 利用R进行主成分分析 一、主成分分析实例 表6.1是某市工业部门13个行业的8项重要经济指标的数据,这8项经济指标分别是: X1:年末固定资产净值,单位
文档评论(0)