- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计量地理学第七章
第七章 地理系统的聚类分析与判别分析
§1 地理系统的聚类分析
一、地理系统分类的意义和作用
地理系统是一种多要素、多类型、多种区域组合在一起的、具有特殊结构与功能的综合体。因此对地理系统的研究很重要的一个问题就是要进行地理分区与分类。
目前,地理学的分类已从传统的、主要依靠经验和定性的知识进行分类而转向应用数学的方法和电子计算机进行定量分类。这种方法被称为“数值分类法”、“数量分类法”或“聚类分析”。
聚类分析是根据地理变量(或样品)的属性或特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,最后得到一个能反映个体之间或群体之间的亲疏关系的分类系统。
第七章 地理系统的聚类分析与判别分析
在进行聚类分析时,首先要根据一批地理数据或指标找出能度量这些数据或指标相似程度的统计量;然后以统计量作为划分类型的依据,把一些相似程度较大的样品首先聚合为一类,把另一些聚合为另一类。依次类推,关系密切的样品便聚合到一小类,而关系疏远的站点则聚合到一大类,直到把所有的点都聚合完毕,便可逐步画成一张完整的分类系统图,又称谱系图。
聚类分析法的基本特点是:事先无需知道分类对象的分类结构,而只需要一批地理数据;选好分类统计量,并按步骤进行计算;最后就可以得到完整的分类系统图。
第七章 地理系统的聚类分析与判别分析
二、聚类分析的数据处理
聚类分析是根据各变量的观测值予以分类的,它涉及到通过各种途径和手段所得到的有意义的地理数据。由于要素(或指标)的量纲、数量级和数量变化幅度的差异,如用原始数据进行聚类分析,就会将不同性质、不同量纲、不同数量变化幅度的数值都统计在一起,这样就有可能突出某些数量级大的变量对分类的作用,降低了分类的可靠性。
为此,常对数据进行标准化处理,现分述如下:
第七章 地理系统的聚类分析与判别分析
(一)地理数据的对数变换
在对地理数据进行标准化之前,应先对数据进行对数变换,经对数变换后,数据变幅减小且变均匀。
(二)地理数据的标准化
为了消除量纲的不同,应进一步对数据进行标准化处理。
数据标准化方法较多,常用的方法有:
1. 标准差标准化
2. 极差标准化
例如:对我国新疆地区6个地点的数据进行处理后,可得表7-2
第七章 地理系统的聚类分析与判别分析
第七章 地理系统的聚类分析与判别分析
三、聚类分析的统计量
聚类分析统计量可分两大类,即相似系数和距离系数。
(一)相似系数
相似系数是描述地理数据之间相似程度的一种指标。
1. 夹角余弦(cosθ) 设有n个地点,每个地点有m个特征值,如把每个地点的特征值看作是多维空间的一个向量,则两个地点之间的相似程度可用两个向量间夹角的余弦来表示,即
i和j代表两个地点,xk表示第k个特征值或指标。上式也叫相似系数。
第七章 地理系统的聚类分析与判别分析
把两两地点之间的相似系数都计算出来,便可排成一个相似系数矩阵:
这一方阵是实对称矩阵,其主对角线元素为1,只须计算其上三角或下三角阵即可,依此便可进行聚类。cosθij的取值范围在-1到+1之间,其值越大,越相似,归为一类;其余可归属于另一些类别。
第七章 地理系统的聚类分析与判别分析
2. 相关系数(r) 为了衡量要素(变量)或指标之间的亲疏关系,常用相关系数(rij)作为分类统计量,计算公式可参照相关系数定义。
在数据标准化后,相关系数可简化成
式中,i和j代表两个地点,xk代表第k个指标。
计算出的任意两两变量(指标)间的相关系数,构成一个相关阵(R)
第七章 地理系统的聚类分析与判别分析
(二)距离系数(简称距离)
假设把我们研究的对象(地点或样品)视为m维空间的点,所谓距离,就是用各种方法计算出各点间的相互距离,并以它来刻画各点间的相似性或亲疏程度。距离系数有多种,现仅介绍两种如下:
1. 绝对距离
绝对距离表达式为
2. 欧氏距离
欧氏距离是一种常用的分类统计量,其距离系数可按下式计算:
距离系数越小,两点间的相似程度越大,反之则小。
第七章 地理系统的聚类分析与判别分析
四、地理系统的聚类方法
(一)系统聚类法概要
地理分类和分区是地理学研究的中心内容之一。根据分类目的不同,聚类分析可分两类:一类是对地点、地区或样品进行分类,称为Q型聚类分析;另一类是对要素、指标或变量进行分类,称为R型聚类分析。
聚类方法有多种,如:系统聚类法、逐步聚类法、逐步分解法和最优分割法等。其中,以系统聚类法应用最广。其基本作法是:先将n个地点(或样品)看成各自成一类,并定义样品间、类与类之间的距离,进而选择距离最小的一对合成一新类,以后计算新类与其他类间的距离,再将距离最近的两类合并,这样每合并依次都减少一类,直到所有的样品都成为一类为止。
第七章 地理系统的聚类分析与判别分析
在定义类与类之间距离方面,也有许多方法。
您可能关注的文档
- 物流3pl的概述.ppt
- 汽车贴膜导学.ppt
- 一级建造师学习重点111.ppt
- 第4章 混凝土1.ppt
- 生物分离12.ppt
- 第4讲测边网条件平差.ppt
- 第5章外墙外保温常见质量问题520.ppt
- 第三章重力场第1234节.ppt
- 第7讲原辅料与包装材料20120618.ppt
- 第五章保函.ppt
- [54101121]1.2地球运动的地理意义——太阳视运动+课件+2025-2026学年高二上学期+地理+人教版+选择性必修一.pptx
- 宏观|8月数据是否继续承压?.docx
- 江苏省盐城市七校联盟2026届高三上学期9月第一次学情检测语文+答案.pdf
- 江苏省盐城市七校联盟2026届高三上学期9月第一次学情检测生物+答案.pdf
- 1 白鹭 教学设计 2025-2026学年统编版语文五年级上册.docx
- 航海装备Ⅱ行业深海科技系列报告:无人协同,以深制海.docx
- [54084823]Unit+2+My+friends++Part++A++Let+'s+talk+&+learn+(课件)-2025-2026学年人教PEP版(2024)英语四年级上册.pptx
- [54088339]3.2用频率估计概率(教学课件)数学北师大版九年级上册.pptx
- [54087024]4.6人体生命活动的调节复习课件2025-2026学年人教版生物八年级上册.pptx
- 2025年博格华纳:涡轮增压龙头 研发并购、战略转型.pdf
文档评论(0)