- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地理系统的聚类分析
第六章地理系统的聚类分析
1
2
…
n
地点
1
2
…
m
指标
第六章 地理系统的聚类分析
§1 聚类分析的基本思想
二、原始数据处理
(一)数据的对数变换
(二)数据的标准化
标准差标准化
级差标准化
第六章 地理系统的聚类分析
二、原始数据处理
(二)数据的标准化
标准差标准化
其中:
§1 聚类分析的基本思想
变换后,每一列均值为0,方差为1,且与指标的量纲无关。
第六章 地理系统的聚类分析
二、原始数据处理
(二)数据的标准化
极差标准化
§1 聚类分析的基本思想
变换后,数据的变化范围都在0到1之间,也消除了量纲的影响。
第六章 地理系统的聚类分析
§1 聚类分析的基本思想
三、分类统计量
(一)相似系数
1.夹角余弦(cosθ)
二维空间:
x1
x2
O
xj1
xi1
xj2
xi2
Pi(xi1,xi2)
Pj(xj1,xj2)
P1
P2
第六章 地理系统的聚类分析
三、分类统计量-夹角余弦
三维:
n 维:
§1 聚类分析的基本思想
二维:
式中:i和j代表两个地点(样品),xik,xjk分别代表第
个地点和第j个地点的第k个地理指标值。
第六章 地理系统的聚类分析
三、分类统计量-夹角余弦
§1 聚类分析的基本思想
相似系数矩阵
性质:
对角线元素为1
对称方阵
取值范围:-1~1
绝对值越大,相似程度越强。
第六章 地理系统的聚类分析
§1 聚类分析的基本思想
三、分类统计量
(一)相似系数
2.相关系数(r)
在数据标准化后,相关系数公式简化为:
式中:i和j代表两个地点(样品),xik,xjk分别代表第i个地点和第j个地点的第k个地理指标值。
第六章 地理系统的聚类分析
三、分类统计量-相关系数
§1 聚类分析的基本思想
相关阵
性质:
对角线元素为1
对称方阵
取值范围:0~1
取值越大,相关程度越强。
第六章 地理系统的聚类分析
§1 聚类分析的基本思想
三、分类统计量
(二)距离系数
1.绝对距离(dij(1))
式中:i和j代表两个地点(样品),xik,xjk分别代表第i个地点和第j个地点的第k个地理指标值。
第六章 地理系统的聚类分析
§1 聚类分析的基本思想
三、分类统计量
(二)距离系数
2.欧氏距离(dij(1))
空间中两点的距离:
称为三维空间中的欧几里德距离,简称欧氏距离。
距离小表示两点接近,反之则远离。
第六章 地理系统的聚类分析
三、分类统计量-夹角余弦
§1 聚类分析的基本思想
n维空间中:i(xi1,xi2,…,xim),j (xj1,xj2,…,xjm)
式中:i和j代表两个地点(样品),xik,xjk分别代表第i个地点和第j个地点的第k个地理指标值。
欧氏距离系数:
第六章 地理系统的聚类分析
三、分类统计量-欧氏距离
§1 聚类分析的基本思想
距离系数矩阵
性质:
对角线元素为0
对称方阵
取值越小,相似程度越强。
第六章 地理系统的聚类分析
§2 主要聚类方法
一、系统分类法
聚类分析的分类:
Q型聚类分析
R型聚类分析
基本做法:
将n个地点各自看成一类,定义类与类间的距离;
选择距离最小的一对合成一新类;
计算新类与其它类间的距离,重复第一步。
第六章 地理系统的聚类分析
§2 主要聚类方法
一、系统分类法
定义类与类之间距离的方法:
最短距离法
最长距离法
类平均法
重心法
离差平方和法
第六章 地理系统的聚类分析
§2 主要聚类方法
二、聚类形成的方法
(一)最短距离法
应用广泛;
定义两类之间的距离:两类间所有样本中最近的两个样本距离;
dij表示地点i与j的距离;
G1,G2,…表示类别。
新类的记号
旧类的记号
第六章 地理系统的聚类分析
二、聚类形成的方法-最短距离法
例:有一组5个区域,2个指标的地理资料矩阵如表所示。试对这5个区域用最短距离法进行聚类分析。
§2 主 要 聚 类 方 法
第六章 地理系统的聚类分析
二、聚类形成的方法-最短距离法
1.数据的标准差标准化处理。
§2 主 要 聚 类 方 法
2.计算初始距离系数矩阵D(0)。
第六章 地理系统的聚类分析
二、聚类形成的方法-最短距离法
1. 在D(0)中,选出距离系数最小的,即d12=0.043,将G1和G2合并成新类G6,记为G6={G1,G2},并记入联结表中。
§2 主 要 聚 类 方 法
再利用最短距离公式计算G6与其它各类之间的距离。
从而形成距离系数矩阵D(1)。
第六章 地理系统的聚类分析
二、聚类形成的方法-最短距离法
§2 主 要 聚 类 方 法
计算G7与其它各类之间的距离
文档评论(0)