- 1
- 0
- 约1.16万字
- 约 19页
- 2017-04-14 发布于江苏
- 举报
地理系统要素关系的主成分分析
地理工作者在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的特征和“职能”,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会增加分析问题的复杂性,能否通过某些线性组合,使原始变量减少为有代表意义的少数几个新的变量,以少数几个指标或“成分”来代表多数指标?这是对地理系统进行分析的关键问题。例如在环境研究中,需要对许多环境要素进行观测;在土地资源研究中,需要对土壤样品进行多指标的分析化验。例如有30个测试指标,也许10多种指标即可代表。由此可见减少研究的要素,使系统简化,是地理学研究中的重要环节。事实上,如果复杂的地理系统,不加以任何简化,不抓住对地理系统影响的主要矛盾,要对之进行深入的研究,几乎是不可能的。
本章介绍解决上述问题的数学方法——主成分分析,它是原始变量的线性组合,但较原始变量更集中更典型地表明研究对象的特征。因为主成分析的数学原理比较简单易懂,因此它在地理学研究中应用较为广泛。
7.1主成分分析方法的原理
主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法。设有n个地理区域,每个地理区域测得p个指标,总共有n*p观测数据。若n=100,p=10,则有1000个地理数据,如何从这么多指标的数据中抓住地理事物的内在规律性呢?如前所述,多数情况下,指标之间存在着相关关系,这时要弄清它们的规律须在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,一个自然的想法是找较少的综合指标来代表原来较多的指标,而这些较少的综合指标既能尽量多地反映原来较多指标的信息,它们彼此之间又是独立的。综合指标如何选取呢?通常是取原指标的线性组合,使综合指标之间相互独立且代表性最好。
如果原来单项指标记为;它们的综合指标记为。特别当p=2时,原指标是。
设n个散布点大致为一个椭圆型。如图7-1,若在椭圆长轴方向取坐标Z1,在椭圆短轴方向取坐标Z2,这相当于在平面上作一个坐标变换,显然变换后的坐标有下述性质。
图 7-1 主成分分析的几何意义
(1)n个点的坐标的相关几乎为0。
(2)二维平面上n 个点的波动(方差)大部分可以归结为轴上的波动,而轴上的波动是较小的。
于是称是原指标的主成分。如果图7-1的椭圆是相当扁平的,则可考虑方向上的波动,忽视方向的波动,不会犯很大错误。比如,这个椭圆的长轴方向将整个信息反映了75%,那么,仅用来表达还是可以的,这样二维就可以降为一维了,就是的综合指标。显然:
(7-1)
如果取椭圆的短轴作为第二主成分,图上的点对原指标的值记作;对主成分的值记作,则有
(7-2)
所谓所反映的信息,就是在整个平方和中占的比例,这个比例越大越好,即的平方和(方差)越大越好。取什么方向使它的平方和(或方差)达到极大呢?这就是主成分分析首先要解决的问题。
如果有p个指标,将它们综合成个指标,即
(7-3)
系数由下列原则来决定:
(1)与互相无关;
(2)是的一切线性组合中方差最大的;是与不相关的的所有线性组合中方差最大的;…;是与都不相关的的所有线性组合中方差最大的。
这样决定的综合指标分别称做原指标的第一,第二,…,第m主成分。其中在总方差中占的比例最大,其余主成分的方差依次递减。在实际工作中常挑选前几个最大的主成分,这样既减少了指标的数目,又抓住了主要矛盾,简化了指标之间的关系。
从几何上看,找主成分的问题,就是找出p维空间中椭球体的主轴问题,从数学上容易得到它们是的相关矩阵中m个较大特征值所对应的特征向量。
7.2 主成分分析的解法
下面用一个简单的例子来说明主成分分析的解法。
设有一组地理研究样品的两个变量。所测量的数据列于表7-1。图7-2是表7-1数据的散布图。
表7-1中的方差的方差与的协方差(为多元回归分析中的除以自由度)即方差--协方差矩阵为
表7-1 双变量的原始数据
3 2 12 10 4 10 12 11 6 5 13 6 6 8 13 14 6 10 13 15 7 2 13 17 7 13 14 7 8 9 15 13 9 5 17 13 9 8 17 17 9 14 18 19 10 7 20 20 11 12
图7-2 双变量数据散布图
我们可以在同一坐标系统中,用向量来表示方差和协方差,如图7-3。在轴上取,为了表示和协方差的关系,在端点作一条直线平行,使其长度等于协方差值15.6,这样便可得到一点,将此点与坐标原点相连,得到向量I;用类似方法取,并作向量II。
图7-3 方差和协方差的向量表示
根据矩阵的特征值和特征向量的几何
您可能关注的文档
- 硅(人教版必修1).ppt
- 华局长:民办教育教育事业半壁江山.ppt
- 华塑CAE 75 安装说明.doc
- 积极利用资本市场.doc
- 基本遗传算法(GA).ppt
- 绩效考核方案(最终稿).doc
- 交变电流 电磁场和电磁波综合讲解.doc
- 就业签约与其权益保护.ppt
- 就业权益保护(二).ppt
- 劳动关系管理讲义.ppt
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
最近下载
- 2021届高考物理三轮冲刺重难点训练:磁场(解析版).pdf VIP
- IDC数据时代2025白皮书_数据时代2025资源The Digitization of the World From Edge to Core.pdf VIP
- 《民航服务心理学(第2版)》项目二(改).pptx
- 民航服务心理学(第2版)严光玉课后习题答案.pdf VIP
- 《民航服务心理学(第2版)》课程标准.docx VIP
- 高考物理压轴题.pdf VIP
- 【高考真题】2023年新高考物理真题试卷——湖南卷(含答案).pdf VIP
- 欧洲规范-NF P18-561-中文版.pdf VIP
- 调相机系统构成及原理培训教材(课件49张).ppt VIP
- 2024届浙江省杭州市高考一轮复习培优提升卷(一)语文试卷含答案.docx VIP
原创力文档

文档评论(0)