- 3
- 0
- 约8.03千字
- 约 11页
- 2017-11-25 发布于河南
- 举报
多元论文我国工业经济效益作因子分析
1 问题提出
上网查询江苏省辖下的县市的十个以上的经济指标,并用主成分分析法和系统聚类分析对数据进行处理,得出结果,并对结果进行分析,提出相关建议。
2 模型的建立
2.1 主成分分析知识:
简介:主成分分析的数学模型是:设p个变量构成的p维随机向量为X=(X1,X2,…,Xp)‘。对X作正交变换,令Y=T’X,其中T为正交阵,要求Y的各分量是不相关的,并且Y的第一个分量的方差是最大的,第二个分量的方差次之,……为了保持信息不丢失,Y的各分量方差和与X的各分量方差和相等。
原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。
基本思想:主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再
原创力文档

文档评论(0)