计量地理学-3.4-聚类分析.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量地理学-3.4-聚类分析

聚类要素的数据处理 距离的计算 准备工作 直接聚类法 最短距离聚类法 最远距离聚类法 Differences? 系统聚类法计算类之间距离的统一公式 扩展引申 系统聚类分析实例 应用 聚类分析 分类? 聚类? 将研究对象按照特定属性的标准、规则、特征、规律等进行类型划分。 e.g. 按照城市人口总数将城市划分为特大城市、大城市、中小城市;按照年龄段将人划分为少年、青年、中年和老年。 Classification 将研究对象的变量统计数据进行特定规则的探索分析,依据某些标准将这些研究对象聚集成不同的类别。(事先并不预知这些类别的特征) e.g. 依据研究对象的距离计算结果,按照距离最近原则,将这些对象进行类别聚集。 Clustering 聚类要素的数据处理 假设有m 个聚类的对象,每一个聚类对象都有n个变量/要素构成。它们所对应的要素数据可用下表给出: m个聚类对象,需要被聚集为若干类别 每个对象都由相同的n个变量来描述 每个变量都有m个样本观测数值 每个对象都有n个变量的具体取值 区代号 人均 耕地X1 /(hm2·人-1) 劳均 耕地X2 /(hm2·个-1 ) 水田 比重 X3 /% 复种 指数x4 /% 粮食 单产x5 /(kg·hm -2) 人均粮食x6 /(kg·人-1 ) 稻谷占粮食比重x7/% G1 0.294 1.093 5.63 113.6 4 510.5 1 036.4 12.2 G2 0.315 0.971 0.39 95.1 2 773.5 683.7 0.85 G3 0.123 0.316 5.28 148.5 6 934.5 611.1 6.49 G4 0.179 0.527 0.39 111 4 458 632.6 0.92 G5 0.081 0.212 72.04 217.8 12 249 791.1 80.38 G6 0.082 0.211 43.78 179.6 8 973 636.5 48.17 G7 0.075 0.181 65.15 194.7 10 689 634.3 80.17 G8 0.293 0.666 5.35 94.9 3 679.5 771.7 7.8 G9 0.167 0.414 2.9 94.8 4 231.5 574.6 1.17 某地区9个农业区的7项经济指标数据 在聚类分析中,描述聚类对象的变量是可选的(e.g. 选择描述经济水平的若干指标变量),但选取的变量对于聚类分析结果有着极重要的影响作用,直接影响聚类结果的准确性和可靠性。 因此当聚类要素的变量对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。 在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。 不同要素的数据往往具有不同的单位量纲和数量级,其数值的变异可能是很大的,这就会对聚类结果产生一定影响。 数据标准化 消除不同变量的量纲差异;统一不同变量的数量级 ① 总和标准化 分别求出各聚类要素所对应的样本观测数据的总和,以各要素的数据除以该要素数据的总和,即 经过综合标准化方法所得到的新数据满足: ② 标准差标准化 将各聚类要素所对应的样本观测数据,减去其平均值求得离差值,然后再除以标准差,即: 由标准差标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有: ③ 极大值标准化 ④ 极差标准化 经过极大值标准化所得的新数据,各要素的极大值为1,其余各数值小于1。 经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。 区代号 人均 耕地X1 /(hm2·人-1) 劳均 耕地X2 /(hm2·个-1 ) 水田 比重 X3 /% 复种 指数x4 /% 粮食 单产x5 /(kg·hm -2) 人均粮食x6 /(kg·人-1 ) 稻谷占粮食比重x7/% G1 0.294 1.093 5.63 113.6 4 510.5 1 036.4 12.2 G2 0.315 0.971 0.39 95.1 2 773.5 683.7 0.85 G3 0.123 0.316 5.28 148.5 6 934.5 611.1 6.49 G4 0.179 0.527 0.39 111 4 458 632.6 0.92 G5 0.081 0.212 72.04 217.8 12 249 791.1 80.38 G6 0.082 0.211 43.78 179.6 8 973 636.5 48.17 G7 0.075 0.181 65.15 194.7 10 689 634.3 80.17 G8 0.293 0.666 5.35 94.9 3 679.5 771.7 7.8 G9 0.167 0.414 2.9 94.8 4 231.5 574.6 1

文档评论(0)

33894522 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档