09GIS-计-10-聚类-判别分析.ppt

09GIS-计-10-聚类-判别分析.ppt

欧氏距离 欧氏距离平方 余弦相似测度 皮尔逊相关系数 切比雪夫距离 网格距离 闵可夫斯基距离 相似系数测度方法 Z得分 标准化到-1~1范围 标准化到0~1范围 标准化到最大值1 标准化到均值1 标准化到标准差1 数据变换方法 6)Save按钮/弹出如下对话框…… 7)OK,…… 样品隶属类 不保存样品隶属类表 保存规定分类数的样品隶属类表 保存规定第n1—n2的分类样品的隶属类表 n1 n2 * 聚类分析与判别分析 第 4 节 分类问题 事先不知该分几类 已经建立分类(已知分几类) 确定未知(待判)样品所属的类 根据样品相似情况进行归组并类 聚类分析 判别分析 多元统计 定量分类方法 学习 探索 一、聚类分析 1. 聚类分析基本思想 聚类分析 群分析 1)聚类分析方法的分类 * 分类对象 Q-型聚类 R-型聚类 对样品的分类 对变量/指标的分类 * 分类方法 系统聚类法 动态聚类法 2)聚类分析的基本思想 * 系统聚类分析的基本思想 样品或指标/变量各视为一类 将最相似的类合并 根据类与类之间 距离或相似程度 计算新类与其它类之间的距离或相似程度 选择最相似的类加以合并 至所有样品或指标/变量合并为一类为止 反复循环 * 动态聚类法的基本思想 按一定方法选取一批聚类中心 计算平均中心 形成分类 样品按就近原则向聚心凝聚 按就近距离原则不断修改分类至合理 循 环 3. 聚类分析对数据的要求 各变量/指标量纲、及变化幅度应大致相近 各变量/指标之间应相互独立 4. 聚类分析的统计量 * 相似系数 * 距离系数P84 夹角余弦 相关系数 绝对距离 欧氏距离 明科夫斯基距离 切比雪夫距离 样品 明科夫斯基距离 切比雪夫距离 闵可夫斯基距离 欧氏距离 欧氏距离平方 余弦相似测度 皮尔逊相关系数 切比雪夫距离 网格距离 闵可夫斯基距离 5. 聚类方法 根据类与类之间距离的定义: 最短距离p86 最远距离p89 重心法…… 6. 聚类分析的步骤(例)P85 P87 P89 直接聚类法 最短距离聚类法 最远距离聚类法 组间连接法 组内连接法 最近距离法 最远距离法 重心法 中位数法 最小偏差平方和法 聚类方法 (极差变换后) 直接聚类法 P85 P84表3.4.3 计算距离, 构造距离矩阵 4, 9 5, 7 2, 8 3, 4 →3, 4, 9 1, 2 →1, 2, 8 5, 6 →5, 7, 6 1, 3 →1, 2, 8, 3, 4, 9 1, 5 →1, 2, 8, 3, 4, 9, 5, 6 , 7 直接聚类法 P85-86 1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 10(4,9) d(10, 1)=Min[d(4,1),d(9,1)]=2.19 d(10, 2)=Min[d(4,2),d(9,2)]=1.47 d(10, 3)=Min[d(4,3),d(9,3)]=1.20 d(10, 5)=Min[d(4,5),d(9,5)]=4.77 d(4,5)=d(5,4) d(10, 6)=Min[d(4,6),d(9,6)]=2.99 d(10, 7)=Min[d(4,7),d(9,7)]=3.32 d(10, 8)=Min[d(4,8),d(9,8)]=1.29 系 统 聚 类 法 最短距离法 P86-89 2.99 1.29 11(7,5) d(11, 1)=Min[d(7,1),d(5,1)] d(11, 2)=Min[d(7,2),d(5,2)] d(11, 3)=Min[d(7,3),d(5,3)] d(11, 8)=Min[d(7,8),d(5,8)] d(11, 10)=Min[d(7,10),d(5,10)] d(10, 1)= d(10, 2)= d(10, 3)= d(10, 6)=? d(10, 7)=? d(10, 7)=? 最短距离法 P86-89 最远距离法 P89-92 Min[d(4,1),d(9,1)]=2.19 Max[d(4,1),d(9,1)]=2.19 10(4,9) 系 统 聚 类 法 Min[d(4,2),d(9,2)]=1.47 Max[d(4,2),d(9,2)]=1.66 Min[d(4,3),d(9,3)]=1.20 Max[d(4,3),d(9,3)]=1.23 二、判别分析 1. 判别分析问题 根据地理系统 /研究对象的一些指标 /变量的数量特征,判别其类型归属的一种多元

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档