第九讲系统聚类.docxVIP

  • 11
  • 0
  • 约5.81千字
  • 约 8页
  • 2021-03-10 发布于山东
  • 举报
第九讲 系统聚类分析 人们往往会碰到通过划分同类属性的对象很好的解决问题的情形, 而不论这些对象是个 体、公司、产品甚至行为。为此常用的技巧是聚类分析。聚类分析将个体或对象分类,使得 同一类的对象之间的相似性比与其他类的对象的相似性更强。 目的在于使类间对象的同质性 最大化和类与类间对象的差异性最大化。 一、 导言 近些年类, 统计学的多元分析方法有了迅速的发展, 多元分析技术自然被引用到分类学 中,于是从数值分类逐渐分离出聚类分析这个新的分支。 我们认为,所研究的样品或指标(变量)之间存在着程度不同的相似性(亲疏关系) 。 于是根据一批样品的多个观测指标, 具体找出一些能够度量样品或指标之间的相似度的统计 量,以这些统计量为划分类型的依据,把一些相似度较大的样品(或指标) ,聚合为一类, 把另一类彼此之间相似程度较大的样品 (或指标) 又聚合为另一类, 关系密切的聚合到一个 小的分类单位, 关系疏远的聚合到一个大的分类单位,直到把所有样品 (或指标) 都聚合完 毕,把不同类型一一划分出来, 形成一个由小到大的分类系统。 最后把整个分类系统画成一 张分类图(又称谱系图) ,用它把所有样品(或指标)间的亲疏关系表示出来。 在经济、社会、人口研究中,存在着大量分类研究、构造分类模式的问题。过去人们主 要靠经验和专业知识, 作定性分析处理, 致使许多分类带有主观性的任意性, 不能很好的揭 示客观事物内在本质差别和联系, 特别是对于多因素、 多指标的分类问题, 定型分类更难以 实现准确分类。 为了克服定型分类时存在的不足, 统计学这个有用的工具逐渐被引进到分类学中, 形成 数值分类学。 随着多元分析的引进, 聚类分析可以用来对案例进行分类, 也可以用来对变量 进行分类。对样品的分类常称为 Q 型聚类分析,对变量的分类常称为 R 型聚类分析。与多 元分类的其他方法相比, 聚类分析的方法是很粗糙的, 理论上还不完善, 但由于它能解决许 多实际问题,很受人们的重视,和回归分析、判别分析一起被称为多元分析的三大方法。 SPSS for Windows 的系统聚类分析其统计结果与图形有凝聚顺序表、相似矩阵、聚类 成员结果的范围;且可绘制垂直冰柱图、水平冰柱图或树状结构图等。 聚类分析根据用户选择不同的聚类方法、不同的量度、是否标准化、不同联结的图形,其分类的结果是不尽相同的。 二、 样品( Q 型)聚类分析 以地级行政单元作为区域分析的对象,利用多元统计分析方法对河北省 11 个地级市的 农村基础设施状况进行分析。 其指标的选择主要根据代表性原则、 综合性原则、 系统性原则、 易获得性原则, 选取 2007 年河北省社会经济发展指标因子 8 项,组成一个原始数据矩阵 X , 作为分析的依据。所选取的指标有:乡村劳动力资源( x1)、农用机械总动力( x2)、农村用 电量( x3 )、农村社会总产值( x4)、自来水受益村 (x5)、通电话村 (x6) 、有效灌溉面积 (x7 )、 农村运输业固定资产( x8)。 表 9-1 指标数据表 乡 村 劳 农用机械 农村用电 农村社会 自来受 通电村 有 效 灌 农 村 运 输 业 固 城市 动 力 资 总动力 量(万千 总产值 益村 数 溉 面 积 定 资 产 源(人) (千瓦) 瓦小时) (万元) (个) (个) ( 公顷) (万元) 石家庄 624877 3980 4418 495628 525146 唐山 3785 5020 499068 547760 秦皇岛 113192 847 2262 124364 138657 邯郸 448244 4590 5347 535707 435227 邢台 241519 4954 5172 553587 379118 保定 321625 4116 6210 655113 431368 张家口 68599 2863 4067 249021 159708 承德 121829 1620 2552 138738 182419 沧州 537227 5679 5741 561042 332882 廊坊 386814 3164 3222 283788 280718 衡水 267634 4933 4982 473719 138165 资料来源: 2008年河北农村统计年鉴 (一) 打开 SPSS 11.5 输入数据后选择 Analyze/Classify/Hierarchical Cluster... 得到 图9-1 图 9-1 单击打开系统聚类分析主对话框见图 9-2。 ① Variable (变量)列表,进行聚类分析的变量。本例为 x1-- x8 Lable Cases by(识别个案),本例为城市 Cluster(聚类方法),可

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档