- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析在多指标权重选择中的应用
目前,国内外对多指标的综合评价有许多方法。根据权重确定的不同方法可分为两类:一类是主观赋权法,如等级分析法、德尔菲法等,主要是综合评价的定性方法。这类方法因受到人为因素的影响,往往会夸大或降低某些指标的作用,致使排序的结果不能完全真实地反映事物间的现实关系。另一类是客观赋权法,即根据各指标间的相关关系或各项指标值的变异程度来确定权数,避免由于人为因素带来的偏差,如主成分分析法、因子分析法,等等。本文介绍的主成分分析法在将原始变量转变为主成分的过程中,同时形成了反映主成分和指标包含信息量的权数,以计算综合评价值。这样在指标权重选择上克服了主观因素的影响,客观地反映了样本间的现实关系。
一、 fpsdv主成分的确定
主成分分析就是设法将原来众多的具有一定相关性的指标(比如p个指标),重新组合成一组新的相互无关的综合指标来代替原来的指标。通常数学上的处理就是将原来p个指标作线性组合,若没有限制条件作为新的综合指标,这样的线性组合会有很多,那么如何去选取呢?主成分分析的基本思想是:如果将选取的第一个线性组合即第一个综合指标记为F1,自然希望F1尽可能多的反映原来指标的信息。这里的“信息”最经典的方法就是用F1的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来p个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不在需要出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,称F2为第二主成分,依次类推可以造出第三,第四……第p个主成分。不难想象这些主成分之间不仅不相关,而且它们的方差依次递减,因此在实际工作中,就挑选前几个最大主成分。虽然这样做会损失一部分信息,但是由于抓住了主要矛盾,并从原始数据中进一步提取了某些新的信息,这种既减少了变量的数目又抓住了主要矛盾的做法有利于问题的分析和处理。
设有n个样品,每个样品观测p个指标,将原始数据写成矩阵:
X=[x11x12?x1px21x22?x2p????xn1xn2?xnp]
1.将原始数据标准化。用Z-score法对数据进行标准变化:Ζij=(xij-ˉxj)/Sj,式中,
ˉxj=nΣi=1xij/nS2j=Σnxi=1(xij-ˉxj)2/(n-1)i=1,2,?,nj=1,2,?,p
2.求指标数据的相关系数矩阵。R=(rjk)p×pj=1,2,…,p k=1,2,…,p rjk为指标j与指标k的相关系数。 3.求相关矩阵R的特征值和特征向量,确定主成分。若特征根记为λ1≥λ2≥…≥λp≥0,相应的单位特征向量为:αi=(α1iα2i…αpi)′i=1,2,…,p
将标准化后的指标变量转换为主成分:Fi=α1iZ1+α2iZ2+…+αpiZpi=1,2,…,p
F1称为第一主成分,F2称为第二主成分,……,Fp称为第p主成分。
4.求方差贡献率,确定主成分个数。一般主成分个数等于原始指标个数,如果原始指标个数较多,进行综合评价时就比较麻烦,主成分分析方法就是选取尽量少的k个主成分(kp)来进行综合评价,同时还要使损失的信息量尽可能少。K值由累计方差贡献率kΣi=1λi/pΣi=1λi≥85%来决定。
5.对k个主成分进行综合评价。先求每一个主成分的线性加权值Fi=αliZ1+α2iZ2+…+αpiZp(i=1,2,…,k),再对k个主成分进行加权求和,即得最终评价值,权数为每个主成分方差的贡献率:
λi/pΣi=1λi,最终评价值F=(λi/pΣi=1λi)Fi(i=1?2???k)
二、 前3个主成分的特征值及贡献率
我们以全国30个省市自治区为例,选取8个指标,运用主成分来考察30个省市的经济发展情况,原始数据如下(见表1):其中x1为GDP,x2为居民消费水平,x3为固定资产投资,x4为职工平均工资,x5为货物周转量,x6为居民消费价格指数,x7为商品零售价格指数,x8为工业总产值。
应用SPSS软件来作主成分分析,可得相关系数阵R和其对应的特征值及特征向量(如表2)。
表3中,前3个特征值累计贡献率已达87.668%,说明前3个主成分基本包含了全部指标具有的信息。
取前3个特征值,并由其对应的特征向量可得前3个主成分(见表4):
F1=0.875Z1+0.701Z2+0.906Z3+0.649Z4+0.764Z5-0.267Z6-0.293Z7+0.874Z8
F2=-0.288Z1+0.518Z2-0.132Z3+0.558Z4+0.269Z5+0.726Z6+0.499Z7-0.258Z8
F3=0.363Z1-0.419Z2+0.330Z3-0.365Z4-0.117Z5+0
原创力文档


文档评论(0)