系统聚类分析.pptVIP

  • 2
  • 0
  • 约5.82千字
  • 约 47页
  • 2025-09-02 发布于广东
  • 举报

图3.4.2最短距离聚类谱系图第29页,共47页,星期日,2025年,2月5日五、最远距离聚类法最远距离聚类法与最短距离聚类法的区别在于计算原来的类与新类距离时采用的公式不同。最远距离聚类法的计算公式是(3.4.11)第30页,共47页,星期日,2025年,2月5日例题:对于前面的例子,最远距离聚类法的聚类过程如下:(1)在9×9阶距离矩阵中,非对角元素中最小者是d94=0.51,将第4区与第9区并为一类,记为G10,即G10={G4,G9}。按照公式(3.4.11)分别计算G1,G2,G3,G5,G6,G7,G8与G10之间的距离,得到一个新的8×8阶距离矩阵第31页,共47页,星期日,2025年,2月5日第32页,共47页,星期日,2025年,2月5日(2)在第1步所得到的8×8阶距离矩阵中,非对角线元素中最小者为d57=0.83,故将G5与G7归并为一类,记为G11,即G11={G5,G7}。按照公式(3.4.11)式分别计算G1,G2,G3,G6,G8,G10与G11之间的距离,得到一个新的7×7阶距离矩阵如下第33页,共47页,星期日,2025年,2月5日第1页,共47页,星期日,2025年,2月5日一、聚类要素的数据处理在聚类分析中,聚类要素的选择是十分重要的,它直接影响分类结果的准确性和可靠性。在地理分类和分区研究中,被聚类的对象常常是多个要素构成的。不同要素的数据往往具有不同的单位和量纲,其数值的变异可能是很大的,这就会对分类结果产生影响。因此当分类要素的对象确定之后,在进行聚类分析之前,首先要对聚类要素进行数据处理。第2页,共47页,星期日,2025年,2月5日假设有m个聚类的对象,每一个聚类对象都有n个要素构成。它们所对应的要素数据可用表3.4.1给出。表3.4.1聚类对象与要素数据第3页,共47页,星期日,2025年,2月5日在聚类分析中,常用的聚类要素的数据处理方法有如下几种:①总和标准化。分别求出各聚类要素所对应的数据的总和,以各要素的数据除以该要素的数据的总和,即这种标准化方法所得到的新数据满足(3.4.1)第4页,共47页,星期日,2025年,2月5日②标准差标准化,即由这种标准化方法所得到的新数据,各要素的平均值为0,标准差为1,即有(3.4.2)第5页,共47页,星期日,2025年,2月5日③极大值标准化,即经过这种标准化所得的新数据,各要素的极大值为1,其余各数值小于1。④极差的标准化,即经过这种标准化所得的新数据,各要素的极大值为1,极小值为0,其余的数值均在0与1之间。(3.4.3)(3.4.4)第6页,共47页,星期日,2025年,2月5日例题:表3.4.2给出了某地区9个农业区的7项指标,它们经过极差标准化处理后,如表3.4.3所示。表3.4.2某地区9个农业区的7项经济指标数据区代号人均耕地X1/(hm2·人-1)劳均耕地X2/(hm2·个-1)水田比重X3/%复种指数x4/%粮食单产x5/(kg·hm-2)人均粮食x6/(kg·人-1)稻谷占粮食比重x7/%G10.2941.0935.63113.64510.51036.412.2G20.3150.9710.3995.12773.5683.70.85G30.1230.3165.28148.56934.5611.16.49G40.1790.5270.391114458632.60.92G50.0810.21272.04217.812249791.180.38G60.0820.21143.78179.68973636.548.17G70.0750.18165.15194.710689634.380.17G80.2930.6665.3594.93679.5771.77.8G90.1670.4142.994.84231.5574.61.17第7页,共47页,星期日,2025年,2月5日表3.4.3极差标准化处理后的数据x1x2x3x4X5X6X7G10.911.000.070.15

文档评论(0)

1亿VIP精品文档

相关文档