第二章聚类分析..pptVIP

  • 12
  • 0
  • 约7.47千字
  • 约 64页
  • 2019-05-28 发布于江苏
  • 举报
(二)主要运行结果解释 1. Initial Cluster Centers(给出初始类中心) 2. Iteration History(给出每次迭代结束后类中心的变动) 从表5.18中可以看到本次聚类过程共经历了三次迭代。由于我们在Iterate子对话框中使用系统默认的选项(最大迭代次数为10和收敛判据为0),所以在第三次迭代后,类中心的变化为0,从而迭代停止。 3. Cluster Membership(给出各观测量所属的类及与所属类中心的距离) 表5.19中Cluster列给出了观测量所属的类别,Distance列给出了观测量与所属类中心的距离。(出于排版要求,此表经过加工,因此与原始输出表形态有一定差异)。 表5.18 迭代过程中类中心的变化量 表5.19 各观测量所属类成员表 4. Final Cluster Centers(给出聚类结果形成的类中心的各变量值) 表5.20 最终的类中心表 结合表5.19和表5.20,我们可以看出31个地区被分成3类。第一类包括:江苏、浙江、山东和广东4个省。这一类的类中心三个产业的产值分别为1102.14亿元、6423.01亿元和4454.26亿元,属于三个产业都比较发达的地区。第二类包括:天津、山西、内蒙古、吉林、江西、广西、海南、重庆、贵州、云南、西藏、陕西、甘肃、青海、宁夏和新疆16个地区。这一类的类中心三个产业的产值分别为307.61亿元、795.41亿元和673.63亿元,属于欠发达地区。剩下的11个地区为第三类。这一类的类中心三个产业的产值分别为713.28亿元、2545.20亿元和212.87亿元,属于中等发达地区。 5. 由于我们已经在Save子对话框中设置了在数据文件中生成新的分类变量,所以,在数据编辑窗口中,我们可以看到生成的两个表示分类结果的新变量。变量qcl_1和变量qcl_2分别代表分类号和观测量距所属类中心的距离。 章节练习 样品为:全国31个省市 指标为:地区生产总值\人均GDP\城镇人口比重(城镇化率)\人口规模\万元地区生产总值能耗\ 进行聚类分析:选择合适的聚类方法并对结果作出合理的解释 地区 人均GDP 三产比重 人均消费 人口增长 文盲半文盲 内蒙古 5068 31.1 2141 8.23 15,83 广西 4076 34.2 2040 9.01 13.32 贵州 2342 29.8 1551 14.26 28.98 云南 4355 31.1 2059 12.1 25.48 西藏 3716 43.5 1551 15.9 57.97 宁夏 4270 37.3 1947 13.08 25.56 新疆 6229 35.4 2745 12.81 11.44 甘肃 3456 32.8 1612 10..04 28.65 青海 4367 40.9 2047 14.48 42.92 * 将不同类型的物种进行分类的例子 影响二氧化碳排放各个因素间存在相关性,一个解决办法是主成分分析,另外一个解决办法就是聚类,将相关性强的变量分为一类,从中选出最具代表性的变量. * * * PP * * * * * * * 5.组间平均链接 该个体与小类中每个个体距离的平均 6.组内平均链接 该个体与小类中每个给体距离,以及小类内部每个个体距离的平均 case 欧氏距离 1 2 3 4 5 1 0 8.062 17.804 26.907 30.414 2 8.062 0 25.456 34.655 38.21 3 17.804 25.456 0 9.22 12.806 4 26.907 34.655 9.22 0 3.606 5 30.414 38.21 12.806 3.606 0 三、分类数的确定 可以根据碎石图确定: X轴表示分几类 Y轴表示聚合系数 四、聚类分析步骤 以最短距离法步骤为例: (1)选择样品(指标)距离公式,计算样品的两两距离,得距离阵记为D(0) ,开始每个样品自成一类,这时Dij = dij。 (2)找出距离最小元素,设为Dpq,则将Gp和Gq合并成一个 新类,记为Gr,即Gr = {Gp,Gq}。 (3)根据最短距离法计算新类与其它类的距离。 (4)重复(2)、(3)两步. 如果某一步距离最小的元素不止一个,则对应这些最小元素的类同时合并。 【例5.1】设有六个样品,每个只测量一个指标,分别是1,2,5,7,9,10,试用最短距离法将它们分类。 (1)选择样品距离公式,绝对距离最简单,形成D(0) (2)D(0)中最小的元素是D12=D56=1,于是将G1和G2合 并成G7,G5和G6合并成G8,并利用(5.12)式计算新类与其它类的距离D(1) (3)在D(1)中最小值是D

文档评论(0)

1亿VIP精品文档

相关文档