- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量地理学-3.4-聚类分析
聚类要素的数据处理
距离的计算
准备工作
直接聚类法
最短距离聚类法
最远距离聚类法
Differences?
系统聚类法计算类之间距离的统一公式
扩展引申
系统聚类分析实例
应用
聚类分析
分类?
聚类?
将研究对象按照特定属性的标准、规则、特征、规律等进行类型划分。
e.g.
按照城市人口总数将城市划分为特大城市、大城市、中小城市;按照年龄段将人划分为少年、青年、中年和老年。
Classification
将研究对象的变量统计数据进行特定规则的探索分析,依据某些标准将这些研究对象聚集成不同的类别。(事先并不预知这些类别的特征)
e.g.
依据研究对象的距离计算结果,按照距离最近原则,将这些对象进行类别聚集。
Clustering
聚类要素的数据处理
假设有m 个聚类的对象,每一个聚类对象都有n个变量/要素构成。它们所对应的要素数据可用下表给出:
m个聚类对象,需要被聚集为若干类别
每个对象都由相同的n个变量来描述
每个变量都有m个样本观测数值
每个对象都有n个变量的具体取值
区代号
人均
耕地X1
/(hm2·人-1)
劳均
耕地X2
/(hm2·个-1 )
水田
比重
X3
/%
复种
指数x4
/%
粮食
单产x5
/(kg·hm -2)
人均粮食x6
/(kg·人-1 )
稻谷占粮食比重x7/%
G1
0.294
1.093
5.63
113.6
4 510.5
1 036.4
12.2
G2
0.315
0.971
0.39
95.1
2 773.5
683.7
0.85
G3
0.123
0.316
5.28
148.5
6 934.5
611.1
6.49
G4
0.179
0.527
0.39
111
4 458
632.6
0.92
G5
0.081
0.212
72.04
217.8
12 249
791.1
80.38
G6
0.082
0.211
43.78
179.6
8 973
636.5
48.17
G7
0.075
0.181
65.15
194.7
10 689
634.3
80.17
G8
0.293
0.666
5.35
94.9
3 679.5
771.7
7.8
G9
0.167
0.414
2.9
94.8
4 231.5
574.6
1.17
某地区9个农业区的7项经济指标数据
在聚类分析中,描述聚类对象的变量是可选的(e.g. 选择描述经济水平的若干指标变量),但选取的变量对于聚类分析结果有着极重要的影响作用,直接影响聚类结果的准确性和可靠性。
因此当聚类要素的变量对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。
在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。
不同要素的数据往往具有不同的单位量纲和数量级,其数值的变异可能是很大的,这就会对聚类结果产生一定影响。
数据标准化
消除不同变量的量纲差异;统一不同变量的数量级
① 总和标准化
分别求出各聚类要素所对应的样本观测数据的总和,以各要素的数据除以该要素数据的总和,即
经过综合标准化方法所得到的新数据满足:
② 标准差标准化
将各聚类要素所对应的样本观测数据,减去其平均值求得离差值,然后再除以标准差,即:
由标准差标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有:
③ 极大值标准化
④ 极差标准化
经过极大值标准化所得的新数据,各要素的极大值为1,其余各数值小于1。
经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。
区代号
人均
耕地X1
/(hm2·人-1)
劳均
耕地X2
/(hm2·个-1 )
水田
比重
X3
/%
复种
指数x4
/%
粮食
单产x5
/(kg·hm -2)
人均粮食x6
/(kg·人-1 )
稻谷占粮食比重x7/%
G1
0.294
1.093
5.63
113.6
4 510.5
1 036.4
12.2
G2
0.315
0.971
0.39
95.1
2 773.5
683.7
0.85
G3
0.123
0.316
5.28
148.5
6 934.5
611.1
6.49
G4
0.179
0.527
0.39
111
4 458
632.6
0.92
G5
0.081
0.212
72.04
217.8
12 249
791.1
80.38
G6
0.082
0.211
43.78
179.6
8 973
636.5
48.17
G7
0.075
0.181
65.15
194.7
10 689
634.3
80.17
G8
0.293
0.666
5.35
94.9
3 679.5
771.7
7.8
G9
0.167
0.414
2.9
94.8
4 231.5
574.6
1
原创力文档


文档评论(0)