主成分分析与因子.pptVIP

  • 6
  • 0
  • 约8.18千字
  • 约 10页
  • 2024-12-25 发布于四川
  • 举报

设有k维单位向量即当且仅当a1=u1时,即时,有最大的方差?1。因为。如果第一主成分的信息不够,则需要寻找第二主成分。030201所以约束条件满足。01在约束条件下,寻找第二主成分,取02而,对k维单位向量,若且则有03因为(二)第二主成分所以如果取线性变换:01则的方差就可达到第二大。02第一主成分03第二主成分04…05第k主成分06依此类推07写为矩阵形式:是协方差矩阵Cov(X)的单位特征根构成的矩阵主成分的性质一、均值二、方差为所有特征根之和说明主成分分析把k个随机变量的总方差分解成为k个不相关的随机变量的方差之和。协方差矩阵?的对角线上的元素之和等于特征根之和。其中累积贡献率:前s个主成分共有多大的综合能力,用这s个主成分的方差和在全部方差中所占比重来描述,称为累积贡献率。贡献率:第i个主成分的方差在全部方差中所占比重,称为它的贡献率。贡献率说明该主成分反映了原来k个指标多大的信息,有多大的综合能力。精度分析我们进行主成分分析的目的之一是希望用尽可能少的主成分Y1,Y2,…,Ys(s≤k)代替原来的k个指标。到底应该选择多少个主成分,在实际工作中,采用的主成分个数s的多少取决于它们是否能够反映原来变量85%以上的信息量,即当累积贡献率≥85%时,主成分的个数就足够了。一些常见的问题中主成分为2到3个。021.数据的标准化对样本数据矩阵Xk?n中的数据Xij进行标准化处理:2.两个重要结论处理后的数据构成的矩阵记为xx的协方差矩阵Cov(x)的特征根和单位特征向量与原来数据X的协方差矩阵Cov(X)的特征根和单位特征向量相同.0111.1.6一个简单的等价算法由X的原来数据所求得的相关系数矩阵Rk?k=标准化后的协方差矩阵Cov(x)3.主成分的简化算法(1)由X的原始数据求出相关系数矩阵Rk?k;(2)求R的特征根?1,?2,…,?k(从大到小排列)及一组相互正交的单位特征向量b1,b2,…,bk;(3)取?1,?2,…,?q,使得累积贡献率满足则即为所求。对于步骤(3),也可以按如下方式进行:1取所有特征根大于1的特征向量(设有s个)来计算主成分,即2注:这种方法计算得到的主成分个数,可能与(3)中不同,因而有可能累积贡献率达不到85%以上。3例在企业经济效益的评价中,涉及的指标往往很多.为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分.在对我国部分省,市,自治区独立核算的工业企业的经济效益评价中,涉及到9项指标,x1—100元固定资产原值实现产值,X2—100元固定资产原值实现利税,X3—100元资金实现利税,X4—100元工业总产值实现利税,X5—100元销售收入实现利税,X6—每吨标准煤实现工业产值,X7—每千瓦时电力实现工业产值,X8—全员劳动生产率,X9—100元流动资金实现产值(数据见ex1102)Y1=[0.928*x1+0.977*x2+0.935*x3+0.232*x4+0.460*x5+0.934*x6+0.894*x7+0.959*x8+0.904*x9]/(6.363)1/2Y2=[-0.329*x1+0.150*x2+0.310*x3+0.873*x4+0.568*x5-0.210*x6-0.288*x7-0.01679*x8-0.174*x9]/(1.470)1/2注:SPSS实际上计算的并非主成分的系数b,而是因子分析的因子系数a,两者之间的关系是具体请见后面的因子分析.2.1概述因子分析(factoranalysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为(公共)因子。例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。11.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档