主成分分析的计算步骤.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析的计算步骤 样本观测数据矩阵为: x11 x12 x1 p X x21 x22 x2p xn1 xn2 xnp 第一步:对原始数据进行标准化处理 * xijxij x * xij xij xj var(Xj ) (i 1,2, ,n;j 1,2, ,p) 其中xj 其中 xj 1 n -xij n i 1 第二步:为方便,var(Xj)(Xij12 xj)计算样本相关系数矩阵假定原始数据标准化后仍用(j1,2, 第二步: 为方便, var(Xj) (Xij 1 2 xj) 计算样本相关系数矩阵 假定原始数据标准化后仍用 (j 1,2, ,P) r12 「1p rp2 r 1 pp X表示, 则经标准化处理后的数据的相关系数为 1r 1 r 1 j ? n 1 n xti xtj t 1 (i,j 1,2, , P) 第三步:用雅克比方法求相关系数矩阵 R的特征值(1 第三步: 用雅克比方法求相关系数矩阵 R的特征值( 1, 2 p)和相应的特征向量 ai ai1, ai2, aip , i 1,2 P。 第四步:选择重要的主成分,并写出主成分表达式 主成分分析可以得到 p个主成分,但是,由于各个主成分的方差是递减的,包含的信 息量也是递减的,所以实际分析时,一般不是选取p 息量也是递减的,所以实际分析时,一般不是选取 p个主成分,而是根据各个主成分累计 贡献率的大小选取前 k个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重, 实际也就是某个特征值占全部特征值合计的比重。即 贡献率=——i— p i 1 贡献率越大,说明该主成分所包含的原始变量的信息越强。 主成分个数k的选取,主要 根据主成分的累积贡献率来决定,即一般要求累计贡献率达到 85%^±,这样才能保证综合 变量能包括原始变量的绝大多数信息。 另外,在实际应用中,选择了重要的主成分后,还要注意主成分实际含义解释。主成分 分析中一个很关键的问题是如何给主成分赋予新的意义, 给出合理的解释。 一般而言,这个 解释是根据主成分表达式的系数结合定性分析来进行的。 主成分是原来变量的线性组合, 在 这个线性组合中个变量的系数有大有小, 有正有负,有的大小相当,因而不能简单地认为这 个主成分是某个原变量的属性的作用, 线性组合中各变量系数的绝对值大者表明该主成分主 要综合了绝对值大的变量, 有几个变量系数大小相当时, 应认为这一主成分是这几个变量的 总和,这几个变量综合在一起应赋予怎样的实际意义, 这要结合具体实际问题和专业, 给出 恰当的解释,进而才能达到深刻分析的目的。 第五步:计算主成分得分 根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分 下的各个样品的新数据,即为主成分得分。具体形式可如下。 Fil F12 Fik F21 F22 F2k Fn1 Fn1 Fn2 Fnk 第六步:依据主成分得分的数据,则可以进行进一步的统计分析 其中,常见的应用有主成份回归,变量子集合的选择,综合评价等。

文档评论(0)

zsmfjh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档