主成分分析法总结.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析法总结 在实际问题研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 一、概述 在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项 目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这 必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种 更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会 造成信息的大量丢失。主成分分析正式这样一种能够有效降低变量维数,并已 得到广泛应用的分析方法。 主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点: ?主成分个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模, 这将大大减少分析过程中的计算工作量。 ?主成分能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ?主成分之间应该互不相关 通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数 据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。 ?主成分具有命名解释性 总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成 少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。 主成分分析的具体步骤如下: 计算协方差矩阵 计算样品数据的协方差矩阵:Σ=(sij)p?p,其中 1?nsij ? n ? 1 1 ?n ? ( x ? x ki i  )( x kj x ) j  i,j=1,2,…,p k 1 ? a 求出Σ的特征值 i 及相应的正交化单位特征向量 i ? Σ的前m 个较大的特征值?1??2?…?m0,就是前 m 个主成分对应的方差, i 对应的单 位特征向量ai 就是主成分 Fi 的关于原变量的系数,则原变量的第i 个主成分 Fi 为: a Fi = i X ? 主成分的方差(信息)贡献率用来反映信息量的大小, i 为: ? ? ? i i / ?m ? i i ?1 选择主成分 最终要选择几个主成分,即F1,F2,……,Fm 中 m 的确定是通过方差(信息)累计贡献率G(m)来确定 G(m) ? ?m ? / ?p ? i k i ?1 k ?1 当累积贡献率大于 85%时,就认为能足够反映原来变量的信息了,对应的m 就是抽取的前 m 个主成分。 计算主成分载荷 主成分载荷是反映主成分Fi 与原变量Xj 之间的相互关联程度,原来变量 X(j j=1,2 ,…, p)在诸主成分 Fi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。: l(Z ,X i ) ? ? j i a (i ? 1,2, L , m; j ? 1,2, L , p) ij 在 SPSS 软件中主成分分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵。 计算主成分得分 计算样品在m 个主成分上的得分: F ? a X i 1i 1 a X 2i 2 ? ... ? a X pi  p i = 1,2,…,m 实际应用时,指标的量纲往往不同,所以在主成分计算之前应先消除量纲的影响。消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数据变换: x* ? ij x ? x ij j s i ? 1,2,..., n; j ? 1,2,..., p j x ? j 其中:  1 ?n n  x s2 ij j , ? 1 ?n n ?1 ?  (x ? x )2 ij j i?1 i 1 根据数学公式知道,①任何随机变量对其作标准化变换后,其协方差与其相关系数是一回事,即标准化后的变量协方差矩阵就是其相关系数矩阵。②另一方面,根据协方差的公式可以 推得标准化后的协方差就是原变量的相关系数,亦即,标准化后的变量的协方差矩阵就是 原变量的相关系数矩阵。也就是说,在标准化前后变量的相关系数矩阵不变化。 根据以上论述,为消除量纲的影

文档评论(0)

tianya189 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体阳新县融易互联网技术工作室
IP属地上海
统一社会信用代码/组织机构代码
92420222MA4ELHM75D

1亿VIP精品文档

相关文档