8第八章地理系统要关系的主成分分析.docVIP

8第八章地理系统要关系的主成分分析.doc

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8第八章地理系统要关系的主成分分析

地理系统要素关系的主成分分析 地理工作者在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的特征和“职能”,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会增加分析问题的复杂性,能否通过某些线性组合,使原始变量减少为有代表意义的少数几个新的变量,以少数几个指标或“成分”来代表多数指标?这是对地理系统进行分析的关键问题。例如在环境研究中,需要对许多环境要素进行观测;在土地资源研究中,需要对土壤样品进行多指标的分析化验。 而这些要素和指标之间,常存在密切关系,要考察全部要素和测试指标,常常要做大量重复的工作。例如有30测试指标,也许10多种指标即可代表。由此可见减少研究的要素,使系统简化,是地理学研究中的重要环节。事实上,如果复杂的地理系统,不加以任何简化,不抓住对地理系统影响的主要矛盾,要对之进行深入的研究,几乎是不可能的。本章介绍主成分分析方法就是解决上述问题的数学方法。 §1 主成分分析方法原理 主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法,达到降维和去相关目的,既由多个变量变换为少数几个相互独立的综合变量。主成分分析也称K-L变换。因子分析不仅可以用来研究变量之间的相关关系,还可用来研究样品之间的相关关系,通常将前者称之为R型因子分析,后者称之为Q型因子分析。 假设有n个地理样本,每个样本观测p个指标,如何从这么多指标的数据中抓住地理事物的内在规律性呢?如前所述,多数情况下,指标之间存在着相关关系,这时要弄清它们的规律须在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,一个自然的想法是找比较少的综合指标来代表原来较多的指标,而这些较少的综合指标既能尽量多地反映原来较多指标的信息,它们彼此之间又是独立的。综合指标如何选取呢?通常是取原指标的线性组合,适当调它们的系数,使综合指标之间相互独立且代表性最好。 记原来的变量指标为,综合指标(新综合变量)为() 即 可以要求 (单位向量)以限制取值大小,利于对比。 系数由下列原则来决定: (1) 与 互相无关(独立); (2)是的一切线性组合中方差最大者; 为与不相关的的所有线性组合中方差最大者; … 为与都不相关的 的所有线性组合中方差最大者。 分别称做原指标的第一,第二,…,第m个主成分。在总方差中占的比例最大,其余主成分所占方差比例依次递减。 从几何上看,找主成分的问题,就是找出p 维空间中椭球体的主轴问题,从数学上容易得到它们是的相关矩阵中m个较大特征值对应的特征向量。也就是说寻找这样的坐标系旋转角,使得样本点在新坐标系中对主成分轴上的投影具有极大的方差。 主成分分析的实质就是要求出方差—协方差矩阵的特征向量及其对应的特征值,即要找出方差—协方差矩阵所确定的椭球的主轴,并确定其长度。 由于提取主成分的主要原则是使方差最大,为了排除量纲、数量级的影响,对原始数据先进行标准化处理(标准差标准化),这样方差—协方差矩阵即为相关系数矩阵。 计算步骤: 计算相关系数矩阵R (原始数据已进行标准化处理变换,也就是方差—协方差矩阵) 计算特征值和特征向量 求出特征值,按大小排序 然后,求出对应的特征向量 i=1,2,…,p (3) 计算主成分贡献率和累积贡献率 可以证明:的方差等于; 的方差等于; … 的方差等于; 主成分的贡献率 i=1,2,…,p 累积贡献率 一般取累积贡献率达85-90%的特征值 对应的主成分即可。 计算主成分载荷 (i=1,2,..,p;k=1,2,…,m) 是主成分与变量之间的相关系数 计算主成分得分 是标准差标准化后的数据 得到主成分得分矩阵 主成分几大性质: 性质1:主成分的协方差矩阵对角阵 性质2:主成分的总方差等于原始变量的总方差 : 性质3: (i=1,2,..,p;k=1,2,…,m) 是主成分与变量之间的相关系数 §2 因子分析法 对p个变量进行因子分析的目的是研究它们有哪些共同因素,哪些是特殊因素,这些因素在变量分析中起什么作用。为研究方便,设着p个变量已进行标准差标准化变换,记为,或表示为向量形式。 上述的p个因子(变量)会有一些共同因素,这些共同因素称为公共因子,记为(公共因子数目m通常要比原因子个数p要少),也可记为向量形式。对每一因子,除了可以有一些公共因素的部分外,还有一些自身特殊因素,称为特殊因子。因而因子模型可表示为下面形式:对第k个因子有 式中称为m个公共因子的荷载,为第k个因子的特殊部分。U为

文档评论(0)

bendaoganqunlia + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档