主成分分析完整版本.pptVIP

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息提取失败,麻烦您主成分分析完整版本.ppt

主成分分析曹明芹流行病与卫生统计学教研室主成分分析(principalcomponent)研究多个指标或变量之间的依存关系,经常会遇到如下问题:变量过多,分析复杂性和难度增加——降维变量间存在共线性(变量间不完全独立),导致分析结果不稳定或不正确——消除多重共线性主成分分析是一种处理上述问题的有效手段和方法。一、主成分的基本原理一、主成分的基本原理寻找一个适当的线性或非线性变换,将若干个彼此相关的变量转变为彼此独立的新变量,然后根据新变量的方差大小,选取几个方差较大的新变量替代原变量,使得用较少的几个新变量就能综合反映原变量中包含的主要信息且又各自带有独特的专业含义。新变量(综合变量)称为原变量的主成分二、主成分的定义例4.1对某小学10名9岁男生六个项目的智力测量得分如下,试评价其智力情况。例4.1相关系数矩阵二、主成分的定义二、主成分的定义二、主成分的定义主成分实际是原指标变量的线性组合或综合变量主成分间彼此相互独立第一主成分解释或包含的信息最多,依次往下,第m个主成分解释或包含的信息最少所有的主成分包含原始指标变量的所有信息三、主成分分析估计主成分——估计原变量线性组合系数确定主成分的个数解释主成分的实际意义估计主成分得分(分值),进一步分析1.估计主成分的系数向量例4.1相关矩阵的特征根例4.1相关矩阵的特征向量主成分的性质主成分间彼此互不相关Cor(Ci,Cj)=0系数向量间彼此正交:积和为0每个主成分的系数向量均为单位向量:平方和为1各特征向量之相应元素平方和为1主成分与原变量的相关系数第i个主成分对所有自变量的贡献:所有主成分对某个变量xj的贡献总信息量不变主成分是原变量的线性组合,是对原变量信息的一种提取,主成分不增加总信息,也不减少总信息量,只是对原信息进行重新分配。应用者可根据实际情况选择重要的信息(前几个主成分),作进一步分析。2.确定主成分个数①经验法:主成分的累积贡献率达到70~80%以上;②均数法:选取特征根大于1的主成分。结合这两个原则确定选取的主成分个数。3.解释主成分的实际意义主成分是标准化指标变量的一个线性组合;线性组合系数可描述各个指标变量对主成分的影响作用;系数的绝对值大的变量与主成分关系密切;系数的符号为影响作用的方向;主成分的实际意义可以根据组合系数的绝对值、符号及专业背景来解释。举例:(例4-1)第一主成分是综合指标,其反映六个项目(常识、算数、理解、填图、积木与译码)的综合能力。第二主成分主要是反映动手操作能力第三主成分主要反映归纳演绎能力4.计算主成分得分——进一步分析SPSS统计软件计算主成分得分Analyze/DataReduction/Factor四、主成分的应用主成分分析一般不是目的,而是达到目的的一种手段。因此,它多用于大型研究项目的某个中间环节。主成分分析应用:用于多重回归分析,可解决自变量间的共线性问题,避免回归系数反常现象;可减少变量个数,到达降维作用,可用于因子分析、聚类分析、判别分析等。用于综合评价,除可解决变量间共线性和减少分析变量外,还可以提供各评价指标变量的权重系数。(一)主成分回归主成分回归的步骤:1. 针对回归系数反常,进行共线性诊断2. 对一组自变量进行主成分分析:求主成分、确定主成分个数、计算相应的主成分得分3. 将选择的主成分得分作为自变量与应变量y进行回归分析,建立回归模型4. 将主成分得分还原成标准化的原自变量5. 将标准化的自变量还原成原始自变量(一)主成分回归例4-5测得22例胎儿受精龄(周)及外形指标,试建立外形指标推测胎儿周龄的回归模型。(二)主成分评价医学研究中,常需对患者的健康状况、医院的效益、卫生资源的利用等进行综合评价,从而收集相关的一系列的指标变量,用这些指标变量评价时,可能存在的问题:(二)主成分评价例4.4某大学教职工体检资料,试评价各类人群的健康状况。例4.4相关矩阵(1)例4.4相关矩阵(2)(二)主成分评价主成分评价方法用第一主成分进行评价:按大小排序用前两个主成分进行评价:分类用前k个主成分进行评价小结主成分的定义如何确定主成分的个数如何解释主成分的实际意义主成分的应用主成分回归主成分评价作业1.试用主成分评价

文档评论(0)

xiaomiwenku + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档