详细版主成分分析法.pptVIP

  • 76
  • 0
  • 约6.77千字
  • 约 74页
  • 2020-09-10 发布于湖北
  • 举报
结果解释 这里的Initial Eigenvalues就是特征值(数据相关阵的特征值)。头三个成分特征值累积占了总方差的86.596%。后面的特征值的贡献越来越少。 ;.; * 从几何上看,找主成分的问题就是找出p维空间中椭球体的主轴问题,就是要在x1~xp的相关矩阵中m个较大特征值所对应的特征向量。 究竟提取几个主成分或因子,一般有两种方法: 特征值1 累计贡献率0.8 那么如何提取主成分呢? (二)主成分分析的基本思想 ;.; * 假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵 (3.5.1) 综合指标如何选取呢?这些综合指标要想尽可能多地反映原指标的信息,综合指标的表达式中要含有原指标,那么我们通常是取原指标的线性组合,适当调整它们的系数,使综合指标间相互独立且代表性好。 ;.; * 定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标 (3.5.2) 可以看出,新指标对原指标有多个线性组合,新指标对哪个原指标反映的多,哪个少,取决于它的系数。系数lij的确定原则: ① zi与zk(i≠k;i,k=1,2,…,m; j= 1,2,…,p )相互无关; ;.; * ② z1是x1,x2,…,xP的一切线性组合中方差最大者(最能解释它们之间的变化),z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;…; zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第1,第2,…,第m主成分。 ;.; * 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。 从数学上可以证明,它们分别是相关矩阵(也就是x1,x2,…,xP 的相关系数矩阵)m个较大的特征值所对应的特征向量。 ;.; * 三、主成分分析的计算步骤 ;.; * (一)计算相关系数矩阵 rij(i,j=1,2,…,p)为原变量xi与xj标准化后的相关系数, rij=rji,其计算公式为 (3.5.3) (3.5.4) ;.; * (二)计算特征值与特征向量 1、解特征方程    ,求出特征值,并使其按大小顺序排列 ; 2、分别求出对应于特征值  的特征向量   ,要求   =1,即     ,其中 表示向量 的第j个分量,也就是说 为单位向量。 ;.; * 3、计算主成分贡献率及累计贡献率 贡献率 累计贡献率 一般取累计贡献率达85%~95%的特征值 所对应的第1、第2、…、第m(m≤p)个主成分。 ;.; * 4、计算主成分载荷     在主成分之间不相关时,主成分载荷就是主成分zi与变量xj之间的相关系数(在数学上可以证明) 5、各主成分的得分 得到各主成分的载荷以后,可以按照(3.5.2)计算各主成分的得分 (3.5.5) ;.; * (3.5.6) 每个地区的综合评价值为:对各个主成分进行加权求和。权重为每个主成分方差的贡献率。 ;.; * 四、 主成分分析方法应用实例 ;.; * (一)下面,我们根据表3.5.1给出的数据,对某农业生态经济系统做主成分分析。 表3.5.1 某农业生态经济系统各区域单元的有关数据 ;.; * ;.; * 步骤如下: (1)将表3.5.1中的数据作标准差标准化处理,然后将它们代入公式(3.5.4)计算相关系数矩阵(表3.5.2)。 表3.5.2 相关系数矩阵 ;.; * (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(表3.5.3)。由表3.5.3可知,第1,第2,第3主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第1、第2、第3主成分z1,z2,z3即可。 ;.; * 表3.5.3 特征值及主成分贡献率 =4.661/8.9988 ;.; * (3)对于特征值 分别 =4.661

文档评论(0)

1亿VIP精品文档

相关文档