^主成分分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
^主成分分析

为什么要用主成分分析 变量太多 降维简化 例如心理学研究中,描述儿童气质的指标有9个;描述儿童性格的指标有12个;描述儿童活动能力的指标有6个,等等。 变量间相关 变量间独立 如描述儿童生长发育的指标中,身高、腿长和臂长;肩宽、胸宽和臀股宽;胸围、大腿围和臂围,等等。 举例说明 如何利用这些指标对每一儿童的生长发育作出正确评价? 仅用单一指标: 结论片面; 没有充分利用原有数据信息。 利用所有指标: 各指标评价的结论可能不一致,使综合评价困难 工作量大。 相关概念 主成分分析(主分量分析) 从多个数值变量(指标)之间的相互关系入手,利用降维的思想,将多个变量(指标)化为少数几个互不相关的结合变量(指标)的统计方法。 基本思想 寻找新变量(主成分) 该新变量的主要特点: 比原来变量个数少 各个变量间独立 尽可能保留原始变量的信息 主成分分析的应用 1.对样品进行分类(肝病患者分类) 利用主成分得分对样品进行分类 2.对原始指标进行综合(调查表的制定) 以互不相关的较少个综合指标反应众多 原始指标提供的信息。 主成分分析的应用 3.进行综合评价(基于主成分分析法的某医院老年病科医疗质量与效率的评价分析) 4.进行探索性分析(医学生学习倦怠影响因素的主成分分析;基于主成分分析的湿疹效应机制研究) 利用因子载荷阵,找出影响各综合指标的主要原始指标。 应用例1 原始数据(因素,调查表条目等等)X1,X2,...,Xm 计算特征根λ1,λ2,λ3,...,λm 确定主成分数 k 提取主成分Z1,Z2,Z3,...Zk 主成分表达式Zi=ɑ1X1+ɑ2X2+,...,ɑmXm 总体评价表达式Z=β1Z1+β2Z2 +β3Z3 +…+βkZk 特征值(特征根) 主成分个数的选取 保留多少个主成分主要考虑保留部分的累积方差在方差总和中所占百分比(即累积贡献率),它标志着前几个主成分概括信息的多少。 常见的判断方法有: 1.特征值准则:取特征值1的主成分。SPSS软件中默认的方法。 2.累积方差比例原则:一般推荐累积方差达到80%以上时,即可停止选择主成分。 3.利用碎石图:将主成分按特征根从大到小排列,画出特征根随主成分个数变化的散点图,根据图的形状来判断主成分的个数。曲线开始变平的前一个点(拐点)认为是提取的最大主成分数。也就是根据特征根的变化速率来确定。 碎石图 特征向量 调查表数据 将主成分按特征根从大到小排列,画出特征根随主成分个数变化的散点图,根据图的形状来判断主成分的个数。曲线开始变平的前一个点(拐点)认为是提取的最大主成分数。也就是根据特征根的变化速率来确定。 应用举例 注意事项 1.需要提供KOM值,Bartletts球形检验的近似卡方值(相关系数矩阵) 2.需要有各个条目的贡献率和累积贡献率 3.需要提供主成分个数选择的依据(λ1、碎石图或者累积贡献率80%) 4.需要提供特征向量及主成分表达式 5.需要提供成分矩阵(因子载荷阵) 表示各个条目之间的相关程度 最大的相关程度为1。 KOM值:检验变量的偏相关是否很小。KOM值越大表示因子分析效果越好,一般认为0.5时,数据可做因子分析。 Bartletts球形检验:是用来检验相关矩阵是否是单位阵,单位阵表示该因子模型不适宜。若P0.05是表示该矩阵不是单位阵,说明变量间存在较大的相关性,当变量间(调查条目)相关性较小时,应用主城分分析是没有意义的。 保留多少个主成分主要考虑保留部分的累积方差在方差总和中所占百分比(即累积贡献率),它标志着前几个主成分概括信息的多少。 累积方差比例原则:一般推荐累积方差达到80%以上时,即可停止选择主成分。 成份矩阵就是因子载荷矩阵。 每一个载荷量表示主成分与对应变量的相关系数 111 主成分分析 高晓欢 中国全科医学杂志编辑部 目录 基本思想 基本步骤 主要应用 文献举例 注意事项 肝病分类 调查表制定 通过患者的四个肝功能指标,来对肝病患者进行分类 (一)主成分的求法 1. 对各原始指标值进行标准化 为了方便,仍用Xij表示Xij’。 标准化后的数据矩阵 X = 2. 求出X1 , X2 , … , Xm 的相关矩阵R R=Cov(X)= 3. 求出矩阵R的全部特征值(eigenvalue) ?i, 第i个主成分的组合系数ai1, ai2, ?, aim满 足方程组: (r11- ?i) ai1+ r12 ai2+ ?+ r1m aim =0 r21 ai1+ (r22- ?i) ai2+ ?+ r2m aim=0

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档