社会統計第12回主成分分析.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.主成分分析とはテキスト:渡部洋(編著)『心理?教育のための多変量解析入門基礎編』第1章ひとつの集団に対して多くの変数を測定例:複数科目の学力試験,多くの変数を測定する社会調査複数の変数を何らかの方法で合成して,新しい総合的な変数を作りたい.性的寛容性の指数(『社会統計学』第11章)

変数の重みづけによる合成主成分分析(principalcomponentanalysis):合成変数Yの分散が最大となるように,重みwを決定する方法個人差をはっきりさせる回帰分析と異なり,予測すべき外的な変数(基準変数)は存在しない.合成変数Yはデータとして与えられるのではない

第1主成分(firstprincipalcomponent):いくつかの変数から,分散最大化の原理にしたがって合成された変数.第2主成分(secondprincipalcomponent):第1主成分との相関がゼロになるような合成変数のうち,分散が最大のもの変数がp個ある場合,最大でp個の主成分を求めることができる.

主成分分析の主要な目的は,相互に相関のあるp個の変数を,それら変数に含まれる情報を大きく損なうことなく,相互に無相関の,より少ない変数に置き換えること.次元縮約.後述するように,p個の変数の分散を合計すると,p個の主成分の分散の合計に等しい.より少数の主成分の分散を合計したとき,それがもとの全分散とあまり大きく変わらないならば,情報の損失は小さい.

2.2変量データの主成分分析(1)主成分分析を行うデータには多くの変数が含まれるのが一般的.説明のため,2変数の場合を考える.例題:20人の大学生X1:教育統計学(stat1)X2:心理測定法(stat2)head(pca1)Studentstat1stat2114864228076338084446080556888668884

平均平均X1X2

mean(pca1$stat1)[1]71.2var(pca1$stat1)[1]174.4842sd(pca1$stat1)[1]13.20925mean(pca1$stat2)[1]79.6var(pca1$stat2)[1]90.77895sd(pca1$stat2)[1]9.527799cor(pca1$stat1,pca1$stat2)[1]0.8203255この値は,不偏分散およびその正の平方根.テキストの値と異なる.

合成変数Y合成変数の分散sY2は,X1の分散をs12,X2の分散をs22,X1とX2の共分散をs12として,重みを大きくしていけば合成変数の分散はいくらでも大きくできるので,制約をつける.(1-1)(1-2)(1-3)

合成変数Yの分散あるいはN-1

制約式より,w1の値が決まればw2も決まる第1主成分を合成するときの重みは,分散最大化のため,共分散が正ならば2つの重みを同符号に,負ならば異符号にする後述するように,重みは固有ベクトルとして「まとめて」得られるので,あまり気にしなくてよい.(1-6,1-7)

主成分の分散第1主成分の重み(1-8)(1-4)(1-5)

教育統計学と心理測定法のデータを,Rを使って主成分分析する.pca2-pca1[,2:3]result-prcomp(pca2)summary(result)Importanceofcomponents:PC1PC2Standarddeviation15.624.61ProportionofVariance0.920.08CumulativeProportion0.921.00主成分の分散の平方根

分散の再配分最大化された分散これら2つの分散の合計は,もとの2変数の分散の合計と等しい.主成分分析は,もとの変数の分散の総和を各主成分に再配分する.第1主成分から順にできるだけ大きな分散を占めるようにする.result$sdev^2[1]244.0343421.22882

説明される分散主成分によって説明される分散.このデータでは,第1主成分で92%が説明されている.もとの2変数のかわりに,この合成変数だけを利用してよい.落ちてしまう情報は8%だけ.summary(result)Importanceofcomponents:

文档评论(0)

189****0266 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档