- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主要成分析在多指标综合评价权重问题中的应用
目 录
引言……………………………………………………………………………………… 1
第一章 主成分分析的基本思想……………………………………………………… 2
1.1数学思路……………………………………………………………………… 2
1.2几何解释……………………………………………………………………… 3
第二章 主成分和权重的推导及它们的性质………………………………………… 4
2.1两个线性代数的结论………………………………………………………… 4
2.2主成分的推导………………………………………………………………… 5
2.3权重的计算…………………………………………………………………… 8
2.4主成分的性质……………………………………………………………… 8
数学模型…………………………………………………………………… 9
3.1构造综合评价函数………………………………………………………… 9
3.2样本主成分………………………………………………………………… 10
3.3样本主成分的性质………………………………………………………… 12
3.4主成分模型中各统计量的意义…………………………………………… 12
3.5主成分个数的选取原则…………………………………………………… 13
3.6主成分分析的基本步骤…………………………………………………… 13
3.7主成分分析主要有以下几方面的应用…………………………………… 14
第四章 实例分析…………………………………………………………………… 15
4.1 问题的提出……………………………………………………………… 15
4.2 主成分分析的计算步骤及实例………………………………………… 16
4.3构造综合评价指数的方法……………………………………………… 19
附表1……………………………………………………………………………… 20
参考文献…………………………………………………………………………… 21
致谢………………………………………………………………………………… 22
附录2:英语文献译 ……………………………………………………………… 23
1、英语原文………………………………………………………………………… 23
2、译文…………………………………………………………………………
引 言
一项十分著名的工作是美国的统计学家斯通(stone)在1947年关于国民经济的研究。他曾利用美国1929一1938年各年的数据,得到了17个反映国民收入与支出的变量要素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等。在进行主成分分析后,竟以97.4%的精度,用三新变量就取代了原17个变量。根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济发展或衰退的趋势F3。更有意思的是,这三个变量其实都是可以直接测量的。
主成分分析就是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。
其中关于主成分分析方法的理论先辈们已经做了很多研究,本设计的设立和研究,就是为了寻找一个合理的评价指标体系和比较评价方法,利用主成分分析的方法来获取各个综合指标的权重,构造一个综合评价函数。在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。
主成分分析的基本思想
主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。
在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。要讨论的问题是:
(1)基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。
(2)选择几个主成分。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。
(3
文档评论(0)