非监督学习方法之聚类分析.pptVIP

下载本文档

2
0
约5.96千字
约 55页
2022-05-26 发布于重庆
举报

非监督学习方法之聚类分析.ppt

分解聚类框图初始分类调整分类方案最终结果目标函数达到最优先？第三十一页，共五十五页。例2：已知21个样本，每个样本取二个特征，原始资料矩阵如下表：样本号 1 2 3 4 5 6 7 8 9 10 x1 0 0 2 2 4 4 5 6 6 7 x2 6 5 5 3 4 3 1 2 1 0 11 12 13 14 15 16 17 18 19 20 21 -4 -2 -3 -3 -5 1 0 0 -1 -1 -3 3 2 2 0 2 1 -1 -2 -1 -3 -5 第三十二页，共五十五页。 ∴目标函数 ∴ 解：第一次分类时计算所有样本，分别划到时的E值，找出最大E值对应的样本。 1、开始时，第三十三页，共五十五页。 2、分别计算当划入时的E值把划入时有第三十四页，共五十五页。然后再计算把划入时对应的E值，找出一个最大的E值。一直计算下去… 把划为的E值最大。 ∴ E(1)=56.6 再继续进行第二，第三次迭代… 计算出 E(2) , E(3) , … 第三十五页，共五十五页。次数 E值 1 56.6 2 79.16 3 90.90 4 102.61 5 120.11 6 137.15 7 154.10 8 176.15 9 195.26 10 213.07 11 212.01 第三十六页，共五十五页。第10次迭代划入时，E最大。于是分成以下两类： ∴ 每次分类后要重新计算的值。可用以下递推公式：第三十七页，共五十五页。第三十八页，共五十五页。 §1.6 动态聚类——兼顾系统聚类和分解聚类一、动态聚类的方法概要 ① 先选定某种距离作为样本间的相似性的度量; ② 确定评价聚类结果的准则函数; ③ 给出某种初始分类，用迭代法找出使准则函数取极值的最好的聚类结果。第三十九页，共五十五页。第一章非监督学习方法：聚类分析基本概念相似性测度与聚类准则基于试探的聚类搜索算法系统聚类分解聚类动态聚类第一页，共五十五页。 §1.1 基本概念分类与聚类的区别分类：用已知类别的样本训练集来设计分类器（监督学习）聚类（集群）：用事先不知样本的类别，而利用样本的先验知识来构造分类器（无监督学习）第二页，共五十五页。相似性与距离聚类相似性：模式之间具有一定的相似性，这既表现在实物的显著特征上，也表现在经过抽象以后特征空间内的特征向量的分布状态上。聚类分析定义：对一批没有标出类别的模式样本集，按照样本之间的相似程度分类，相似的归为一类，不相似的归为另一类，这种分类称为聚类分析，也称为无监督分类。第三页，共五十五页。分类依据：一个样本的特征向量相当于特征空间中的一点，整个模式样本集合的特征向量可以看成特征空间的一些点，点之间的距离函数可以作为

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

非监督学习方法之聚类分析.pptVIP