- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章聚类分析
第 8 章 聚类分析
在自然与社会科学研究中,存在着大量分类研究的问题,如病虫害种群消长演替规律 的研究中,需要从生态系统出发,构造其数量、时间和空间关系的分类模式,以此来研 究病虫害的发生规律。聚类分析就是其分类研究的方法之一。
聚类分析是根据事物本身的特性研究个体分类的方法。聚类分析的原则是同一类中 的个体有较大的相似性,不同类中的个体差异很大。
根据分类对象的不同可分为样品聚类和变量聚类。
1)样品聚类
样品聚类在统计学中又称为 Q 型聚类。用 SPSS 的术语来说就是对事件(Cases)进行 聚类,或是说对观测量进行聚类。是根据被观测的对象的各种特征,即反映被观测对象 的特征的各变量值进行分类。
2)变量聚类
变量聚类在统计学又称为 R 型聚类。反映同一事物特点的变量有很多,我们往往根 据所研究的问题选择部分变量对事物的某一方面进行研究。由于人类对客观事物的认识 是有限的,往往难以找出彼此独立的有代表性的变量,而影响对问题的进一步认识和研 究。例如在回归分析中,由于自变量的共线性导致偏回归系数不能真正反映自变量对因 变量的影响等。因此往往先要进行变量聚类,找出彼此独立且有代表性的自变量,而又 不丢失大部分信息。
8.1 快速聚类过程 (K-Means Cluster )
调用此过程可完成由用户指定类别数的大样本资料的逐步聚类分析。所谓逐步聚类 分析就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类。
[例子 8-1]
根据 1962 年至 1988 年积累的三化螟有关资料进行聚类分析,研究三化螟种群消长 规律。数据见表 8-1,其中发生期是指卵盛孵高峰期(2 代以 5 月 31 日和 3 代 7 月 20 日 为零计算天数),F2-F3 为 2 代至 3 代的增殖系数,F3-F4 为 3 代至 4 代的增殖系数。
对幼虫发生量和发生期数据进行快速聚类,分析各年的发生程度。
表 8-1
年份 幼虫发生量 发生期 增殖系数 第 2 代 第 3 代 第 2 代 第 3 代 F2-F3 F3-F4 1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988 344
121
187
500
441
404
328
806
730
263
486
248
2100
333
90
19
230
1392
308
415
34
267
1043
2243
236
558
162 3333
1497
1813
4000
3750
4600
986
1790
1970
333
600
585
2700
287
77
25
2525
1041
41
916
401
803
3500
7452
599
1061
2817 29
27
32
34
36
33
35
32
36
29
32
33
22
38
40
40
39
33
31
36
38
37
39
31
35
33
34 9
19
18
14
14
16
18
15
20
15
19
20
14
19
24
27
20
18
28
18
29
26
26
20
26
24
21 9.69
12.37
9.70
8.00
8.50
11.39
3.01
2.22
2.70
1.27
1.23
2.36
1.28
.86
.86
1.32
10.96
.75
.13
2.21
11.79
3.01
3.36
3.32
2.54
1.90
2.64 1.91
1.34
1.06
1.82
1.87
1.52
1.26
2.14
2.64
1.07
1.47
1.08
1.33
.70
1.87
2.88
.55
4.17
3.34
1.09
.99
.09
.07
.12
.00
.00
.00
8.1.1 操作方法
1)数据准备
在数据管理窗口,定义变量名:年份、幼虫 2、幼虫 3、发生期 2、发生期 3、增殖
23、增殖 34,分别代表年份、第 2 代幼虫发生量、第 3 代幼虫发生量、第 2 代发生期、 第 3 代发生期、F2-F3 增殖系数、F3-F4 增殖系数。其中年份变量为字符变量,其它为数 值变量。然后输入原始数椐。
数据保存在配套光盘中(\SPSS\DATA\DATA8-2.SAV)。
2)启动快速聚类过程
在 SPSS 主菜单中按“Analyze→Classify→K-Means Cluster”顺序逐一单击鼠标键, 打开快速聚类主对话框,如图 8-1 所示。
您可能关注的文档
最近下载
- 2021MAM-6070M空压机微电脑控制器.docx VIP
- 泵房设备安装方案.docx VIP
- GB∕T42430-2024血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验.pptx VIP
- 年南海区第十二届初中综合能力大赛数学模拟试题.pdf VIP
- 戴笠:政治侦探.pdf VIP
- 国开(SC)-数据库运维-形考3(考核内容:第5章~第7章,30%)-学习资料.docx VIP
- 中国视神经脊髓炎谱系疾病诊断与治疗指南解读PPT课件.pptx VIP
- 出口用【箱单+发票】英文.docx VIP
- 部编版小学六年级下册语文单元测试卷全册(含答案).pdf VIP
- 高血压病的护理常规 高血压护理常规.doc VIP
原创力文档


文档评论(0)