- 1、本文档共193页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 聚类分析
“物以类聚,人以群分”
1
聚类分析的实际案例
老师要了解学生数学知识的掌握情况,
该如何做?
将学生分
考试 分析试卷 类,每类
给予相应
的辅导
2
判别分析:对总体的信息有一定的了
解,比如知道一些训练样本的情况.
聚类分析:没有总体的信息,也不知
道应该分成几类.
3
§6.1 引言
§6.2 距离与相似系数
§6.3 系统聚类法
§6.4 动态聚类法
§6.5 有序样品聚类法
§6.6 变量聚类法
4
利用SAS帮助系统找到聚类分析方法
的使用说明和例子的路径:
聚类分析方法的帮助路径:
帮助(H)→SAS帮助和文档(H)
→SAS产品→SAS/stat
→ SAS/stat User’s Guide
→Introduction to Clustering Procedures
5
§6.1 引言
聚类分析要解决的问题:事先不知道
所研究的问题应分为几类,更不知道观测
到的个体的具体分类情况,我们的目的正
是需要通过对观测数据所进行的分析处
理,选定一种度量个体接近程度的统计
量、确定分类数目、建立一种分类方法,
并按亲近程度对观测对象给出合理的分类.
6
(系统)聚类分析的关键步骤:
1. 指标的选取
2. 样品之间距离的刻画
3. 类与类之间距离的刻画
4. 确定最终的分类个数
7
聚类
对观测聚类 对变量聚类
(Q型聚类分析) (R型聚类分析)
VARCLUS过程
系统聚类法 动态聚类法
CLUSTER过程 FASTCLUS过程
8
R型聚类分析的目的:
(1)对变量进行分类;
(2 )可以了解变量间及变量组合间的亲疏关
系;
(3 )根据分类结果及它们之间的关系,在每
一类中选择有代表性的变量作为重要变
量,利用少数几个重要变量进一步作分析
计算,如进行回归分析、判别分析或Q型
聚类分析.
文档评论(0)