SPSS高级统计的分析.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--(完美WORD文档DOC格式,可在线免费浏览全文和下载)值得下载!

SPSS高级统计分析 聚类分析 聚类分析 为什么聚类? 俗语说,物以类聚、人以群分 当有一个分类指标时,分类比较容易 但是多个指标时,进行分类就不是很容易了! 例如,对中国的区县进行分类: 自然条件:降水、土地、日照、湿度等 经济指标:收入水平、教育程度、医疗条件、基础设 施等 平均的方法? 容易忽视相对重要程度的问题 要进行多元分类-聚类分析 聚类分析 聚类分析基本目标 一种探索性的数据分析技术 基本目标:在数据中寻找某种“ 自然的”分组结构 应用举例 细分市场 消费行为划分 设计抽样方案 聚类分析 方法原理 聚类分析就是要找出具有相似程度的点或类聚为一类 如何衡量这个“相似程度”? 根据距离来确定 “距离”含义很广: 如欧式距离,马氏距离…,相似系数 聚类分析 聚类分析分类 根据分析对象: R型聚类-对变量(指标)进行聚类 Q型聚类-对观测对象(个体、样品)进行聚类 根据方法: 系统聚类(Hierarchical Clustering) 非系统聚类 K-均值聚类 两步聚类 注:没有什么聚类方法,具有绝对优势 聚类分析 系统聚类 可选择适当的距离,计算距离 把每个样品看成一类,构成N个类 合并最近的两类为一新类 采用系统聚类法 计算新类与当前各类的距离 不是仅有一个类 判断 仅有一个类 画聚类图 根据实际情况,确定类和类的个数 聚类分析 系统聚类方法可应用多种距离衡量个体/变量的相似性 利用哪种距离聚类取决于: 所分析的数据类型 哪种距离对于聚类最具有解释意义 距离包括: 最短距离法-Nearest Neighbor( Single Linkage) 最长距离法-Furthest Neighbor (Complete Linkage) 重心法-Centroid Clustering 类平均法-Between-groups Linkage 离差平方和法-Ward’s Method 此外还有中间距离(Median Clustering)、类内平均法(Within- Groups Linkage)等 聚类分析 最短距离法- Nearest Neighbor 对离群值不敏感 聚类分析 最长距离法- Furthest Neighbor 对离群值不敏感 聚类分析 重心法- Centroid Method 对离群值不敏感 不适用于噪声数据 类平均法- Between-Groups Linkage 对离群值敏感 在多数情况下,可以取得较好的聚类结果 可很好地应用于有噪声数据 聚类分析 重心法- Centroid Method 离群值敏感 可适用于噪声数据 趋向于把观测分成数目近乎相等的类群 聚类分析 重心法- Centroid Method 离群值敏感 可适用于噪声数据 趋向于把观测分成数目近乎相等的类群 聚类分析

文档评论(0)

mghkfg58 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档