- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 地理系统的聚类分析与判别分析 第一节 地理系统的聚类分析 聚类分析方法: 是定量地研究地理事物分类问题和地理分区问题的重要方法。常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。 一. 聚类分析的数据处理 在聚类分析中,常用的聚类要素的数据处理方法有如下几种: ① 总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即 这种标准化方法所得到的新数据满足 例:下表给出了某地区九个农业区的七项指标,它们经过极差标准化处理后,如表3.4.3所示. (二) 距离系数 距离:是事物之间差异性的测度,是系统聚类分析的依据。 常见的距离有 : ① 绝对值距离 ② 欧氏距离 ③ 明科夫斯基距离 1.直接聚类法 2. 最短距离聚类法 3. 最远距离聚类法 四. 系统聚类法距离公式的统一表达 最短距离和最远距离:可以用一个公式表示--- 用下图表示二者关系: 五. 系统聚类分析实例 对中国大陆31个省级区域第三产业综合发展水平进行类型划分及差异性程度分析--- 聚类指标选择 (选取如下7项指标 ) ① y1——人均GDP,它反映了经济社会发展的总体状况和一般水平; ② y2——人均第三产业增加值,它反映了人均服务产品占有量或服务密度; ③ y3——第二产业增加值比重,它反映了工业化水平和产业结构现代化程度; 聚类结果分析 ② 在第一步所得到的8×8阶距离矩阵中,非对角线元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即G11={G5,G7}。按照公式分别计算G1,G2,G3,G6,G8,G10与G11之间的距离,得到一个新的7×7阶距离矩阵如下: ③ 在第二步中所得到的7×7阶距离矩阵中,非对角线元素中最小者为d28=0.88,故将G2与G8归并为一类,记为G12,即G12={G2,G8}。再按照公式分别计算G1,G3,G6,G10,G11与G12之间的距离,得到一个新的6×6阶距离矩阵如下: ④ 在第三步中所得的6×6阶距离矩阵中,非对角元素中最小者为d3,10=1.23,故将G3与G10归并为一类,记为G13,即G13={G3,G10}={G3,(G4,G9)}。再按照公式计算G1,G6,G11,G12与G13之间的距离,得到一个新的5×5阶距离矩阵如下: ⑤ 在第四步所得的5×5阶距离矩阵中,非对角线元素中最小者为d1,12=1.52,故将G1与G12归并为一类,记为G14,即G14={G1,G12}={G1,(G2,G8)}。再按照公式分别计算G6,G11,G13与G14之间的距离,得到一个新的4×4阶距离矩阵如下: ⑥ 在第五步所得的4×4阶距离矩阵中,非对角线元素中最小者为d6,11=1.78,故将G6与G11归并为一类,记为G15,即G15={G6,G11}={G6,(G5,G7)}。再按照公式分别计算G13,G14和G15之间的距离,得到: ⑦ 在第六步中所得的3×3阶距离矩阵中,非对角线元素中最小者为d13,14=3.10,故将G13与G14归并为一类,记为G16,即G16={G13,G14}={(G3,(G4,G9)),(G1,(G2,G8))}。再按照公式计算G15与G16之间的距离,可得一个新的2×2阶距离矩阵如下: 图3.4.3 最远距离聚类谱系图 G1 G2 G8 G3 G4 G9 G5 G7 G6 ⑧ 将G15与G16归并为一类。此时,各个分类对象均已归并为一类。 综合上述聚类过程,可以作出最远距离聚类谱系图。 最短距离 最远距离 图3.4.4 两种不同的空间距离 a1 a2 A b1 b2 B 当α、β、γ三个参数取不同的值时,就形成了不同的聚类方法. 系统聚类其他方法的公式 : ④ y4——第三产业增加值比重,它反映了第三产业的发展程度及其对国民经济的贡献; y5——第三产业从业人员比重,它反映了第三产业对劳动力的吸纳能力; ⑥ y6——第三产业固定资产投资比重,它反映了第三产业的资金投入程度; ⑦ y7——城市化水平,它反映了农村人口转化为城市人口的程度及对服务的需求量。 聚类计算(计算过程 ) ① 用标准差标准化方法对7项指标的原始数据进行处理。 ② 采用欧氏距离测度31个省(市、区)之间的样本间距离。 ③ 选用组平均法计算类间的距离,并对样本进行归类。 经过上述聚类计算步骤,得到的聚类结果见下图. 样本 Num +---------+---------+---------
文档评论(0)