多元07:聚类分析概要.ppt

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元07:聚类分析概要

多元统计分析 聚类分析 §3.4 系统聚类法 Hierarchical clustering method 二、聚类方法 例:小康指数:综合、结构、经济、人口、生活、治安 2、最长距离(Furthest Neighbor ) 四类: 北京上海天津 浙江广东福建江苏山东辽宁 甘肃江西……西藏 黑龙江吉林……海南 4、重心法(Centroid clustering) 四类: 北京上海天津 黑龙江吉林新疆江苏山东辽宁浙江广东福建 西藏 甘肃江西……海南 三、分类数的确定 给定阈值——观测聚类图,给出一个合适的阈值T 统计量 碎石图 合并类的距离 例:小康指数 平方欧氏距离 组间平均链锁法 四、系统聚类法的统一 统一 2、系统聚类法的性质 单调性 除了重心法和中间距离法之外 §3.6 K—均值聚类 K-means Cluster快速聚类 二、图例 空间的群点 取两个聚核 三、评注 两个种子点:进入一个类中 局外干扰 K类选择 §3.7 SPSS软件实现 Statistics——Classify——Hierarchical Cluster 例:小康指数 功能 Statistics Agglomeration schedule Proximity matrix 功能 方法 距离 转换 聚类方法 Cluster Method Between-groups linkage:类间平均链锁法(系统默认) Within-groups linkage:类内平均链锁法; Nearest neighbor:最近邻居法; Furthest neighbor:最远邻居法; Centroid clustering:重心法?欧氏距离 Median clustering:中间距离法?欧氏距离 Wards method:离差平方和法?欧氏距离 距离 Euclidean distance:Euclidean距离?Q型聚类 Squared Euclidean distance:平方Euclidean距离?Q型聚类 Cosine:变量矢量的余弦,这是模型相似性的度量 Pearson correlation:相关系数距离?R型聚类; Chebychev:Chebychev距离,即两观察单位间的距离为其任意变量的最大绝对差值?Q型聚类 Block:City-Block或Manhattan距离,即两观察单位间的距离为其值差的绝对值和?Q型聚类 Minkowski:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的平方根;p由用户指定 Customized:距离是一个绝对幂的度量,即变量绝对值的第p次幂之和的第r次根,p与r由用户指定。 SPSS操作 小康指数 Q型聚类、类间平均链锁法、平方Euclidean距离 商厦评分 Q型聚类、类间平均链锁法、 Euclidean距离 裁判打分 R型聚类、类间平均链锁法、平方Euclidean距离 结果 概要 距离矩阵 凝聚状态表 结果 类成员表 冰挂图 树形图 其他 变量数量级差别的清除?Transform Values 如何确定分类数目 例:小康指数 计算量大 2、K-means Cluster :快速聚类 Statistics——Classify——K-means Cluster 功能 聚类数目 初始类中心点 聚类方法 Iterate and classify:每一步重新确定类中心点 Classify only:始终按初始类别中心点分类 终止条件 最大迭代次数 类中心偏移量 选项 初始类中心点 方差分析 样本分类信息及距离 案例: 小康指数 3类、初始点由软件定 商厦评分 3类、初始点用户定 结果 初始类中心表 迭代转移 最终类中心表 类成员情况 方差分析表 ?无类成员? ?结果比较 要求 1、掌握SPSS软件的 Classify菜单命令 Hierarchical Cluster、K-means Cluster、Discriminant 2、分析实例 小康指数:系统聚类 小康指数:快速聚类 家庭收支:快速聚类 商厦评分:判别分析 END 主讲人:孙云龙 数学建模课件 SUN 主讲人:孙云龙 数学建模课件 Email:sunyl@swufe.edu.cn 主讲:孙云龙 一、方法步骤 求 dij 合并距离最近的两类为一类 构造n个类,每个类只包含一个样品 计算新类与当前各类距离 类的个数为1? 聚类图 分类 是 否 聚类分析(小康指数) 1、最短距离(Nearest Neighbor) 四类: 北京上海天津 西藏 广东浙江 甘肃…… 缺点:链接聚合趋势 3、组间平均连接(Between-group Linkage) 四类: 北京上海天津 山东江苏辽宁浙江广东福建 海南

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档