计量地理学第八章主成份.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章 地理系统要素关系的主成分分析 在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的特征和“职能”,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会增加分析问题的复杂性,以少数几个指标或“成分”来代表多数指标就成为分析这类问题的关键。 例如:在土地资源研究中,需要对土壤样品进行多指标的分析化验,而这些要素之间很可能存在密切关系,要考察全部要素或指标,需要做大量重复的工作。而以少数指标代替全部指标,则可以使研究问题简化。 本章介绍解决上述问题的数学方法-主成分分析,它是原始变量的线性组合,但较原始变量更集中、更典型地表明了研究对象的特征。 第八章 地理系统要素关系的主成分分析 §1 主成分分析方法的原理 主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法。设有n个地理区域,每个地理区域测得p个指标,总共有np个观测数据。若n=100,p=10,则有1000个地理数据。如何从这么多指标的数据中抓住地理事物的内在规律性呢? 如前所述,多数情况下,指标之间存在着相关关系,这时要弄清楚它们的规律须在p维空间中加以考察,这是比较麻烦的。为了克服这个困难,一个自然的想法是找较少的综合指标来代表原来较多的指标,而这些综合指标既能尽量多地反映原来的信息,彼此之间又是独立的。 综合指标如何选取呢?通常是取原指标的线性组合,适当调整它们的系数,使综合指标之间相互独立且代表性最好。 第八章 地理系统要素关系的主成分分析 如果原来的单项指标记为x1,x2,...xp;它们的综合指标记为z1,z2,..zm(m≤p)。特别当p=2时,原指标是x1,x2。 设n个散布点大致为一个椭圆形。如图8-1,若在椭圆长轴方向取坐标z1,短轴方向取坐标z2,这相当于在平面上作一个坐标变换,变换后的坐标具有下述性质: (1)n个点的坐标z1和z2的相关性几乎为零; (2)二维平面上n个点的波动大部分可以归结为z1轴上的波动。 第八章 地理系统要素关系的主成分分析 于是称z1和z2是原指标x1和x2的主成分。如果图8-1的椭圆是相当扁平的,则可以考虑z1方向上的波动,忽视z2方向的波动,不会犯很大错误。z1就是x1和x2的综合指标。显然有z1=l11x1+l12x2。 反映n个点波动情况的整体离差平方和满足如下关系: 所谓z1反映的信息就是其相关部分在整个离差平方和中的比例,这个比例越大越好。主成分分析就是找出原指标的一系列综合指标,并计算各个综合指标的离差平方和,选取数值较大的几个作为主成分,以作为后面分析的基础。 基本原理 计算步骤 计算相关系数矩阵 rij(i,j=1,2,…,p)为原变量xi与xj的相关系数 。 计算步骤: ① 解特征方程    ,求出特征值,并使其按大小顺序排列,即 ② 分别求出对应于特征值 的特征向量    要求   =1,即     ,其中 表示向量的  第j个分量。 ③ 计算主成分贡献率及累计贡献率 第八章 地理系统要素关系的主成分分析 §2 主成分分析的解法 下面用一个简单的例子来说明主成分分析的解法。 设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度。所测量的数据列于表8-1。图8-2是数据的散布图。 第八章 地理系统要素关系的主成分分析 表8-1中x1为贝壳长度,其方差σ2x1=20.3;x2为贝壳宽度,其方差σ2x2=24.1;x1与x2的协方差COV(x1,x2)=COV(x2,x1)=15.6。可用方差-协方差矩阵表示。 我们可以在同一坐标系统中,用向量来表示方差和协方差,如图8-3。 主成分分析的实质就是要求出方差-协方差矩阵的特征向量及其对应的特征值,即要找出方差-协方差矩阵所确定的椭球的主轴,并确定其长度。图8-4表示方差和协方差所确定的椭圆,其长轴Ⅰ为第一主成分,短轴Ⅱ为第二主成分。这可由方差-协方差矩阵计算得到。 根据计算的结果可知,第一主成分为Z1=0.66x1+0.75x2,其方差为37.9;第二主成分Z2的方差为6.5。二者之和与x1和x2的总方差相等。可见,两个主成分所代表的信息分别为86%和14%。 第八章 地理系统要素关系的主成分分析 将表8-1的原始数据代入两个主成分的表达式,可得出一组新的数据,称为主成分得分,见表8-2。 由于提取主成分的主要原则是使方差最大,为了排除数量级、量纲的影响,在具体应用这一方法时,一般先对原始数据进行标准化处理。这时数据的方差-协方差矩阵即为原始数据的相关矩阵。 由此,可以把主成分分析的步骤归纳如下: 将原始数据标准化(消除量纲的影响) 建立变量的协差阵(标准化后即相关系数阵) 计算相关系数阵的特征根及相应的单位特征向量 计算主

文档评论(0)

dart001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档