主成分分析讲解精编PPT课件.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* Dept. of Epidemio Biostat, SPH * 实例的标准化第一、二主成分得分 * Dept. of Epidemio Biostat, SPH * 主成分数目的保留—降维问题 保留多少个主成分取决于保留部分的累积方差在方差总和中所占百分比,它标志着前几个主成分概括信息之多寡。 实际上就是看特征值 λ 的大小 保留多少主成分为宜主要根据实际问题和经验决定,并无严格统计规则。 * Dept. of Epidemio Biostat, SPH * 主成分分析的应用 综合指标的抽取 主成分回归 解决自变量严重共线性问题 主成分判别 解决解释变量的共线性问题 变量聚类中计算相似系数 因子分析 * Dept. of Epidemio Biostat, SPH * 例--主成分回归 22例胎儿受精龄(Y,周)与胎儿外型测量指标: 均数 标准差 身高(X1, cm) 33.05 9.71 头围(X2, cm) 23.26 6.86 体重(X3, g) 936.9 690.3 试求由X1、X2、X3推算Y的回归方程 * Dept. of Epidemio Biostat, SPH * 例--主成分回归 结果1 直接做多重回归结果 * Dept. of Epidemio Biostat, SPH * X1、X2、X3与Y的相关阵 X1 X2 X3 Y X1 1 X2 0.998 1 X3 0.944 0.947 1 Y 0.952 0.943 0.970 1 * Dept. of Epidemio Biostat, SPH * 主成分分析结果 (表中上半部的系数矩阵是矩阵A) C1 C2 C3 x1 0.58 -0.42 0.70 x2 0.58 -0.39 -0.71 x3 0.57 0.82 0.02 Var 2.93 0.07 0.00 % 97.54 2.38 0.08 累积% 97.54 99.92 100 * Dept. of Epidemio Biostat, SPH * 主成分回归分析结果 * Dept. of Epidemio Biostat, SPH * 主成分回归分析结果 附:本例岭回归分析结果 * Dept. of Epidemio Biostat, SPH * 主成分分析应用实例—综合指标选取 计算主成分的两种方法 如果各变量具有同等尺度 对角化相关阵还是协方差阵? 从协方差阵计算主成分的一个特点: 方差大的变量倾向在第一主成分上占有更大的比重(与从相关阵计算比较)。 * Dept. of Epidemio Biostat, SPH * 广州市某年空气污染指标的主成分分析结果 从相关阵计算 从协方差阵计算 C1 C2 C3 C1’ C2’ C3’ iNOx 0.63 -0.17 -0.76 0.93 -0.30 -0.21 iTSP 0.51 0.82 0.25 0.29 0.95 -0.06 iSO2 0.58 -0.55 0.60 0.21 0.00 0.97 λ 1.88 0.70 0.42 4349 891 350 % 62.7 23.4 13.9 77.8 15.9 6.3 * Dept. of Epidemio Biostat, SPH * 广州市某2个月的空气污染指数 Dept. of Epidemio Biostat, SPH 主成分分析 Principal Component Analysis * Dept. of Epidemio Biostat, SPH * 统计学研究的核心问题? 没有变异就没有统计学 变 异 VARIATION 变异性的度量? 方差 Variance * Dept. of Epidemio Biostat, SPH * 方差是什么? 方差是信息 多元世界的信息度量 多元世界的每个变量的包含信息不同 在单个变量方差不变的情况下,各变量相关性越高,则总信息量越小 * D

文档评论(0)

ahuihuang1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档