主成分分析方法课件和案例分析.ppt

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析方法课件和案例分析

第一节 主成分分析方法 一、主成分分析的基本原理 二、计算步骤 (一)计算相关系数矩阵 rij(i,j=1,2,…,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为: 三、 主成分分析方法应用实例 * * 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法应用实例 地理系统是多要素的复杂系统。在地理学研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息? 问题的提出: 事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。 从数学角度来看,这是一种降维处理技术。 假定有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵 (3.5.1) 当p较大时,在p维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。 定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标 (3.5.2) 系数lij的确定原则: ① zi与zj(i≠j;i,j=1,2,…,m)相互无关; ② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者; …… zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者。 则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的荷载 lij( i=1,2,…,m; j=1,2 ,…,p)。 从数学上容易知道,从数学上可以证明,它们分别是的相关矩阵的m个较大的特征值所对应的特征向量。 (3.5.3) (3.5.4) (二)计算特征值与特征向量: ① 解特征方程    ,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列 ; ② 分别求出对应于特征值 的特征向量   ,要求   =1,即     ,其中 表示向量 的第j个分量。 ③ 计算主成分贡献率及累计贡献率 ▲贡献率: ▲累计贡献率: 一般取累计贡献率达85—95%的特征值 所对应的第一、第二、…、第m(m≤p)个主成分。 ④ 计算主成分载荷     ⑤ 各主成分的得分: (3.5.5) (3.5.6) 下面,我们根据表3.4.5给出的数据,对某农业生态经济系统做主成分分析, 表3.4.5 某农业生态经济系统各区域单元的有关数据 步骤如下:(1)将表3.4.5中的数据作标准差标准化处理,然后将它们代入公式(3.5.4)计算相关系数矩阵(见表3.5.1)。 表3.5.1 相关系数矩阵 (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3.5.2)。由表3.5.2可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 *

文档评论(0)

xingkongwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档