第16 章主成分分析和因子分析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第16 章主成分分析和因子分析

《统计手册:金融中的统计方法》 第 16 章 主成分分析和因子分析 C.Radhakrishna Rao 1.引言 主成分分析和因子分析(principal component and factor analysis,PCA 和 FA )是用于研究 个体测量指标的协方差(或相关)结构的探索性多元技术。分析的目标可以不同:找出若干 可以解释可观测指标之间的变差或者联系的潜变量而简化高维数据,对相似指标进行分组及 检测多重共线性,将高维数据在低维空间中图示以直观考察数据的散布情况及检测异常值。 PCA 是由 Pearson (1901)和 Hotelling (1933)发展起来的;Rao (1964)给出了基本原理 及一些扩展和运用。FA 首先由 Spearman (1904)提出,接着Lawley (1940)在多元正态性 的假定下发展。Rao (1955)给出了没有任何分布假设的 FA 的原理,命名为典型因子分析 (CFA )。现在已经有许多优秀的、大部的专著致力于社会科学和自然科学研究中 PCA 和 FA 的计算及使用问题。参考文献包括Bartholomew (1987),Basilevsky (1994),Cattel (1978), Jackson (1991),和Jolliffe (1986),这里仅提到少数作者。 当测量指标是定性指标时,和 PCA 有关的一种方法称为对应分析(correspondence analysis,CA ),是 Benzecri (1973)基于 Fisher (1936)提出的定性尺度范畴 (scaling qualitative categories )方法而发展起来的。Greenacre (1984)的专著阐述了CA 的理论及其在列联表分 析中的应用。Rao (1995)的论文包含了 CA 的一种替代方法,和 CA 的用途一致,但看起 来优于早期方法。 本文将提供某些最新理论成果和实际应用以全面考察 PCA 和 FA 。 2.主成分 2.1.一般问题 p y q 主成分问题可以用如下非常一般的步骤进行阐述。令x 是一个 维向量, 是一个 维 向量,其中x 和y 的一些分量可能是相同的。我们要用z Ay 代替y ,其中A 是一个r ×q r q z y 矩阵且 ,使得用 代替 预测x 的损失尽可能小。如果 ⎛Σ Σ ⎞ ⎜⎜ 11 12 ⎟⎟ (2.1 ) Σ Σ ⎝ 21 22 ⎠ 是x 和y 的协方差矩阵,那么用z Ay 预测x 的误差的协方差矩阵就是 W Σ −Σ A ′(AΣ A ′)−1 AΣ (2.2 ) 11 12 22 21 我们选择 A ,使得 W 对一个适当选择的标准而言是小的。如果选择 W tr W ,那么最 优选择是 A∗ arg max trΣ A ′(AΣ A ′)−1 AΣ 12 22 21 A 最大值在 1 《统计手册:金融中的统计方法》 A∗′ (C1 : L: Cr ) (2.3 )

文档评论(0)

wangsux + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档