多变量解析主成分分析.PPTVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多变量解析主成分分析

多変量解析 ~主成分分析~ 第9章 P.132~150   2006/05/26  神津 健太 主成分分析とは 多くの量的変数が存在する場合に、 それらの間の相関構造を考慮して、 低い次元の合成変数(主成分)に変換し、 データが有している情報をより解釈しやすくするための方法。 「相関係数行列から出発する方法」と 「分散共分散行列から出発する方法」の 2種類がるが、今回は前者だけを説明する。 * 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析 5.変数がp個の場合の主成分分析 6.行列とベクトルによる表現 91 93 92 89 10 72 76 44 51 9 47 52 66 78 8 72 64 53 50 7 50 45 33 39 6 63 61 97 96 5 95 98 58 62 4 44 39 43 42 3 84 78 75 71 2 68 67 79 86 1 理科 x4 数学 x3 英語 x2 国語 x1 生徒No. 適用例と解析の目的(1) (P.132~) 表1.試験の成績のデータ それぞれの科目を量的変数と考える。 変数の個数は p = 4 である。 それぞれの相関係数を求めると、 (相関係数の求め方はP.13を参照)   各変数間の相関係数はすべて正となり、   「国語と英語」「数学と理科」の相関係数は高い値となっている。   つまり、データにはなんらかの相関構造があると考えられる。 ?「より低い次元でデータのばらつきを解釈できないか」 ?「そのためにはどのように合成変数(主成分)を構成すればよいか」 ?「それぞれの主成分の説明力はどれくらいか」 ?「科目や生徒をどのように分類できるか」 などを検討したい。 適用例と解析の目的(2) 主成分分析の流れ (1)主成分の導出      相関係数行列 R の第1固有値(最大固有値)λ1 に対応する固有ベクトルから     第1主成分 z1 を求める。次にRの第2固有値λ2 に対応する固有ベクトルから      第2主成分 z2 を求める。同様にして、第 k 主成分 を求める。(k = 3,4,???,p) (2)寄与率および累積寄与率      それぞれの主成分の寄与率および累積寄与率を求める。「固有値が1以上」       ないしは「累積寄与率80%を超える」を目安として主成分を選択する。 (3)因子負荷量      因子負荷量を求める。固有ベクトルや因子負荷量の値を参考にして、選択した     各主成分の意味について考察する。また、因子負荷量を散布図にプロットし、      変数の分類を行う。 (4)主成分得点      主成分得点を散布図にプロットし、サンプルの特徴付けや分類を行う。 変数が2個の場合の主成分分析(1)   変数がx1,x2の2つで、サンプルサイズがnとする。      変数x1,x2を標準化 また、次のこともにも注意しておく。 第1主成分z1を とおく。         だから      である。 目的は、データの情報をできるだけ多く有するようにz1を定めることである。(つまり、係数a1とa2をデータから定めることである。) (1)主成分の導出 (P.134~) 変数が2個の場合の主成分分析(2)   「z1がもとのデータの情報をできるだけ多く有する」  → 「データの全体のバラツキをできるだけz1のバラツキに反映させる」と考える。 z1の分散 が最大となるようなa1とa2を求める。 となるので、Vz1の値は(a1,a2)の値が大きくなればいくらでも大きくなる。 そこで    の制約条件を設けた上で、Vz1の最大化を考える。 制約付きの最大化問題を求めるために、ラグランジュの未定乗数法を用いる。        未定乗数λを用いて とおき、a1,a2のそれぞれで微分(偏微分)してゼロとおく。 両辺を2で割って行列の形に表現 R a = λa 相関係数行列R  λが行列Rの固有値であり、求めるべき[a1,a2]は   固有ベクトルで あることを示している。 変数が2個の場合の主成分分析(3)   変数が2個の場合の主成分分析(4)   両辺に左からベクトル[a1,a2]をかけてみると 以上より、Vz1を最大化させることは 「相関係数行列Rの固有値問題を解いて、最大固有値λ1に  対応する(長さ1の) 固有ベクトル a を求めれば(つまり、  R a =λ1 a)、それがVz1の最大値を与える[a1,a2]であり、  Vz1の最大値はλ1となる

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档