计量地理学第八章主成份.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

计量地理学第八章主成份第1页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析第2页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析问题的提出第3页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析问题的提出第4页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的特征和“职能”,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会增加分析问题的复杂性,以少数几个指标或“成分”来代表多数指标就成为分析这类问题的关键。例如:在土地资源研究中,需要对土壤样品进行多指标的分析化验,而这些要素之间很可能存在密切关系,要考察全部要素或指标,需要做大量重复的工作。而以少数指标代替全部指标,则可以使研究问题简化。本章介绍解决上述问题的数学方法-主成分分析,它是原始变量的线性组合,但较原始变量更集中、更典型地表明了研究对象的特征。第5页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析§1 主成分分析方法的原理主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法。设有n个地理区域,每个地理区域测得p个指标,总共有np个观测数据。若n=100,p=10,则有1000个地理数据。如何从这么多指标的数据中抓住地理事物的内在规律性呢?如前所述,多数情况下,指标之间存在着相关关系,这时要弄清楚它们的规律须在p维空间中加以考察,这是比较麻烦的。为了克服这个困难,一个自然的想法是找较少的综合指标来代表原来较多的指标,而这些综合指标既能尽量多地反映原来的信息,彼此之间又是独立的。综合指标如何选取呢?通常是取原指标的线性组合,适当调整它们的系数,使综合指标之间相互独立且代表性最好。第6页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析如果原来的单项指标记为x1,x2,...xp;它们的综合指标记为z1,z2,..zm(m≤p)。特别当p=2时,原指标是x1,x2。设n个散布点大致为一个椭圆形。如图8-1,若在椭圆长轴方向取坐标z1,短轴方向取坐标z2,这相当于在平面上作一个坐标变换,变换后的坐标具有下述性质:(1)n个点的坐标z1和z2的相关性几乎为零;(2)二维平面上n个点的波动大部分可以归结为z1轴上的波动。第7页,共20页,星期日,2025年,2月5日第八章地理系统要素关系的主成分分析于是称z1和z2是原指标x1和x2的主成分。如果图8-1的椭圆是相当扁平的,则可以考虑z1方向上的波动,忽视z2方向的波动,不会犯很大错误。z1就是x1和x2的综合指标。显然有z1=l11x1+l12x2。反映n个点波动情况的整体离差平方和满足如下关系:所谓z1反映的信息就是其相关部分在整个离差平方和中的比例,这个比例越大越好。主成分分析就是找出原指标的一系列综合指标,并计算各个综合指标的离差平方和,选取数值较大的几个作为主成分,以作为后面分析的基础。第8页,共20页,星期日,2025年,2月5日基本原理问题的提出:有n个地理样本,每个样本共有p个变量,构成一个n×p阶的地理数据矩阵当p较大时,在p维空间中考察问题比较麻烦。定义:(记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标)(1)(2)第9页,共20页,星期日,2025年,2月5日z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分。主成分分析的主要任务就是确定每一个主成分Zi在原变量xj上的载荷lij系数lij的确定原则:①zi与zj(i≠j;i,j=1,2,…,m)相互无关;②z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者;……;zm是与z1,z2,……,zm-1都不相关的x1,x2,…,xP的所有线性组合中方差最大者。第10页,共20页,星期日,2025年,2月5日计算步骤计算相关系数矩阵rij(i,j=1,2,…,p)为原变量xi与xj的相关系数。计算步骤:①解特征方程,求出特征值,并使其按大小顺序排列,即②分别求出对应于特征值的特征向量要求=1,即,其中表示向量的第j个分量。③计算主成分贡献率及累计贡献率(3)第1

文档评论(0)

xiaoshun2024 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档