- 11
- 0
- 约5.81千字
- 约 8页
- 2021-03-10 发布于山东
- 举报
第九讲 系统聚类分析
人们往往会碰到通过划分同类属性的对象很好的解决问题的情形, 而不论这些对象是个
体、公司、产品甚至行为。为此常用的技巧是聚类分析。聚类分析将个体或对象分类,使得
同一类的对象之间的相似性比与其他类的对象的相似性更强。 目的在于使类间对象的同质性
最大化和类与类间对象的差异性最大化。
一、 导言
近些年类, 统计学的多元分析方法有了迅速的发展,
多元分析技术自然被引用到分类学
中,于是从数值分类逐渐分离出聚类分析这个新的分支。
我们认为,所研究的样品或指标(变量)之间存在着程度不同的相似性(亲疏关系)
。
于是根据一批样品的多个观测指标,
具体找出一些能够度量样品或指标之间的相似度的统计
量,以这些统计量为划分类型的依据,把一些相似度较大的样品(或指标)
,聚合为一类,
把另一类彼此之间相似程度较大的样品
(或指标) 又聚合为另一类, 关系密切的聚合到一个
小的分类单位, 关系疏远的聚合到一个大的分类单位,直到把所有样品
(或指标) 都聚合完
毕,把不同类型一一划分出来,
形成一个由小到大的分类系统。
最后把整个分类系统画成一
张分类图(又称谱系图) ,用它把所有样品(或指标)间的亲疏关系表示出来。
在经济、社会、人口研究中,存在着大量分类研究、构造分类模式的问题。过去人们主
要靠经验和专业知识, 作定性分析处理, 致使许多分类带有主观性的任意性,
不能很好的揭
示客观事物内在本质差别和联系,
特别是对于多因素、 多指标的分类问题,
定型分类更难以
实现准确分类。
为了克服定型分类时存在的不足,
统计学这个有用的工具逐渐被引进到分类学中,
形成
数值分类学。 随着多元分析的引进,
聚类分析可以用来对案例进行分类,
也可以用来对变量
进行分类。对样品的分类常称为
Q 型聚类分析,对变量的分类常称为
R 型聚类分析。与多
元分类的其他方法相比, 聚类分析的方法是很粗糙的,
理论上还不完善, 但由于它能解决许
多实际问题,很受人们的重视,和回归分析、判别分析一起被称为多元分析的三大方法。
SPSS for Windows 的系统聚类分析其统计结果与图形有凝聚顺序表、相似矩阵、聚类
成员结果的范围;且可绘制垂直冰柱图、水平冰柱图或树状结构图等。
聚类分析根据用户选择不同的聚类方法、不同的量度、是否标准化、不同联结的图形,其分类的结果是不尽相同的。
二、 样品( Q 型)聚类分析
以地级行政单元作为区域分析的对象,利用多元统计分析方法对河北省
11 个地级市的
农村基础设施状况进行分析。 其指标的选择主要根据代表性原则、
综合性原则、 系统性原则、
易获得性原则, 选取 2007 年河北省社会经济发展指标因子
8 项,组成一个原始数据矩阵
X ,
作为分析的依据。所选取的指标有:乡村劳动力资源(
x1)、农用机械总动力(
x2)、农村用
电量( x3 )、农村社会总产值( x4)、自来水受益村 (x5)、通电话村 (x6) 、有效灌溉面积 (x7
)、
农村运输业固定资产( x8)。
表 9-1 指标数据表
乡 村 劳
农用机械
农村用电
农村社会
自来受
通电村
有 效 灌
农 村 运
输 业 固
城市
动 力 资
总动力
量(万千
总产值
益村
数
溉 面 积
定 资 产
源(人)
(千瓦)
瓦小时)
(万元)
(个)
(个)
( 公顷)
(万元)
石家庄
624877
3980
4418
495628
525146
唐山
3785
5020
499068
547760
秦皇岛
113192
847
2262
124364
138657
邯郸
448244
4590
5347
535707
435227
邢台
241519
4954
5172
553587
379118
保定
321625
4116
6210
655113
431368
张家口
68599
2863
4067
249021
159708
承德
121829
1620
2552
138738
182419
沧州
537227
5679
5741
561042
332882
廊坊
386814
3164
3222
283788
280718
衡水
267634
4933
4982
473719
138165
资料来源: 2008年河北农村统计年鉴
(一)
打开 SPSS 11.5 输入数据后选择 Analyze/Classify/Hierarchical Cluster...
得到
图9-1
图 9-1
单击打开系统聚类分析主对话框见图 9-2。
① Variable (变量)列表,进行聚类分析的变量。本例为 x1-- x8
Lable Cases by(识别个案),本例为城市
Cluster(聚类方法),可
您可能关注的文档
- 第06课画一幅色彩和谐的画.docx
- 第16课南方经济的发展——导学案.docx
- 第1讲包装自己.docx
- 第5章共聚合反应习题参考答案.docx
- 第一学期七年级期末考试数学试卷及答案(7份试卷1份答案).docx
- 第一学期三年级数学李洪海1.docx
- 第一学期四年级数学李洪海.docx
- 第一学期江西吉安万安二中第一次月考七年级语文附答案.docx
- 第一性原理计算原理和方法.docx
- 第一批异性词整理表.docx
- 广东省广州省实验中学教育集团2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州大学附属中学2025-2026学年八年级上学期奥班期中物理试题(解析版).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(含答案).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第八十六中学2025-2026学年八年级上学期期中物理试题(解析版).docx
- 广东省广州市第八十九中学2025-2026学年八年级上学期期中考试物理试题(含答案).docx
- 广东省广州市第二中学2025-2026学年八年级上学期期中考试物理试题(解析版).docx
- 2026《中国人寿上海分公司营销员培训体系优化研究》18000字.docx
- 《生物探究性实验教学》中小学教师资格模拟试题.docx
最近下载
- 《专业工程管理与实务》.pdf VIP
- 中国血栓性疾病防治指南(2025版).docx VIP
- 施工质量日志-.xls VIP
- 2025年国家公务员全国总工会面试题及答案.docx VIP
- 合肥市普通高中六校联盟2025-2026学年高三第一次语文教学质量监测+答案.docx VIP
- 局部晚期食管癌患者新辅助免疫治疗与常规新辅助治疗的比较:系统评价和meta分析.pdf
- 2025以骑手为代表的新就业群体研究报告:职业技能与跑单时长对收入的共同作用.pdf VIP
- 年产一亿片别嘌呤醇的车间工艺设计.doc VIP
- 商务型(带电梯、地下室、效果图)三层别墅设计图.pdf VIP
- 2026年详版个人信用报告征信报告最新Word可编辑模版样板doc文件.docx
原创力文档

文档评论(0)