- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分计算步骤
⑷ 主成分的计算步骤
① 数据的标准化处理
设有只待样本单位,每只单位有个指标,则有矩阵,其中表示第单位的第指标值。矩阵X表示如下:
对上述数据进行标准化处理,标准化处理的计算公式如下:
其中是的算数平均数,是的标准差。并记为标准化之后的数据矩阵。
② 计算标准化数据的协方差矩阵
变量中变两两的相关系数的计算公式是
由于Z中的变量已是标准化的变量,此时Z的列变量的协方差矩阵就是相关系数矩阵。
③ 计算R的特征根和特征向量
相关矩阵R的特征方程为:,利用特征方程可以求出矩阵R的特征根()。将特征根从小到大进行排列,再由特征多项式,求出相应的特征向量,以特征向量的分量值为权数,将标准化的指标进行加权就得到第个主成分。
④ 计算主成分的方差贡献率及累计方差贡献率
相关矩阵的特征根就等于对应的主成分的方差,其大小反映了第个主成分所包含原始数据全部信息的比重,也反映了各主成分贡献的大小。定义第个主成分的方差贡献率为,累计方差贡献率,方差贡献率越大表明第主成分综合变量信息的能力越强,也就是由的差异来解释变量的差异的能力越强,累计贡献率越大表明前个主成分包含原始信息越多。
⑤ 选取主成分的个数
主成分分析的目的之一是为了减少变量的个数,即把最初的个变量转化为少数的几个综合变量,而且这几个少数的综合变量还要尽可能的保留原属数据的信息,从而减少分析的工作量。所以在选取主成分的个数时,一般不会选取全部的个主成分,而是取个主成分,取多少比较合适,这是一个很实际的问题,一方面尽量取的大些,以使选取的主成分能够尽量多的包含原来变量的信息,另一方面又不能太大,越大表明主成分的个数越多,不能做到简化分析的目的。的取值可以兼顾变量的个数和累计贡献率两个方面,一般是以所取的使得累计贡献率达到85%以上为宜。
⑥ 对主成分进行经济分析
确定了个主成分之后,要对主成分进行经济分析。经济分析是确定主成分的经济含义。在主成分的表达式中,取值大的系数表明这个主成分包含对应变量的信息就越多,主成分的经济含义就是在主成分表达式中系数大的变量含义的综合,因此可以根据这个原则来确定主成分的经济解释。
⑦ 计算主成分得分
将标准化的数据带入到主成分的表达式中,得到第个主成分的得分,根据主成分得分的大小就可以分析各个样本单位在各个主成分方面的表现。
⑧ 进行综合排序
每一个主成分表示了分析对象在某一方面的表现。选取的个主成分代表了分析对象的绝大部分信息,对主成分进行综合分析就是相当于对分析对象的全部进行综合分析。以个主成分各自的方差贡献率(特征根)为权数,将个主成分进行加权平均,加权平均的公式为:
或
求得主成分的综合得分F,这个综合得分是在保留了绝大部分信息的情况之下的得分,其大小可以反映分析对象的综合表现。按照主成分得分的大小,确定出各个对象的表现,达到排名的目的。
文档评论(0)