- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!
SPSS高级统计分析
聚类分析
聚类分析
为什么聚类?
俗语说,物以类聚、人以群分
当有一个分类指标时,分类比较容易
但是多个指标时,进行分类就不是很容易了!
例如,对中国的区县进行分类:
自然条件:降水、土地、日照、湿度等
经济指标:收入水平、教育程度、医疗条件、基础设
施等
平均的方法?
容易忽视相对重要程度的问题
要进行多元分类-聚类分析
聚类分析
聚类分析基本目标
一种探索性的数据分析技术
基本目标:在数据中寻找某种“ 自然的”分组结构
应用举例
细分市场
消费行为划分
设计抽样方案
聚类分析
方法原理
聚类分析就是要找出具有相似程度的点或类聚为一类
如何衡量这个“相似程度”?
根据距离来确定
“距离”含义很广:
如欧式距离,马氏距离…,相似系数
聚类分析
聚类分析分类
根据分析对象:
R型聚类-对变量(指标)进行聚类
Q型聚类-对观测对象(个体、样品)进行聚类
根据方法:
系统聚类(Hierarchical Clustering)
非系统聚类
K-均值聚类
两步聚类
注:没有什么聚类方法,具有绝对优势
聚类分析
系统聚类 可选择适当的距离,计算距离
把每个样品看成一类,构成N个类
合并最近的两类为一新类 采用系统聚类法
计算新类与当前各类的距离
不是仅有一个类
判断
仅有一个类
画聚类图
根据实际情况,确定类和类的个数
聚类分析
系统聚类方法可应用多种距离衡量个体/变量的相似性
利用哪种距离聚类取决于:
所分析的数据类型
哪种距离对于聚类最具有解释意义
距离包括:
最短距离法-Nearest Neighbor( Single Linkage)
最长距离法-Furthest Neighbor (Complete Linkage)
重心法-Centroid Clustering
类平均法-Between-groups Linkage
离差平方和法-Ward’s Method
此外还有中间距离(Median Clustering)、类内平均法(Within-
Groups Linkage)等
聚类分析
最短距离法- Nearest Neighbor
对离群值不敏感
聚类分析
最长距离法- Furthest Neighbor
对离群值不敏感
聚类分析
重心法- Centroid Method
对离群值不敏感
不适用于噪声数据
类平均法- Between-Groups Linkage
对离群值敏感
在多数情况下,可以取得较好的聚类结果
可很好地应用于有噪声数据
聚类分析
重心法- Centroid Method
离群值敏感
可适用于噪声数据
趋向于把观测分成数目近乎相等的类群
聚类分析
重心法- Centroid Method
离群值敏感
可适用于噪声数据
趋向于把观测分成数目近乎相等的类群
聚类分析
您可能关注的文档
最近下载
- 混凝搅拌站安全风险分级管控和隐患排查治理双重预防报告(全套).pdf VIP
- 在全市2025年度城乡居民基本医疗保险参保缴费征收工作推进会上的讲话.docx VIP
- 高三地理一轮复习:中国的气候-气候特征.ppt VIP
- 红、黄、绿交通信号灯的PLC控制线路设计.docx VIP
- 社区工作者考试试题库300道附参考答案(精练).docx VIP
- 中小学(幼儿园)女性生活指导老师辅导排查女学生记录表.docx VIP
- 2025年租房合同范本(可直接打印)与租房合同范本(标准版) .pdf VIP
- 胡百精公共关系学课后思考题答案.docx VIP
- 九年级劳动技术教学计划.docx VIP
- 机电传动控制课程设计..pdf VIP
文档评论(0)