聚类,模式识别.ppt

下载文档 降价啦

7
0
约4.99千字
约 53页
2016-10-19 发布于江苏
举报
保障服务

聚类,模式识别.ppt

非监督学习 ——聚类什么是聚类聚类是一种无监督分类法: 没有预先指定的类别分类：用已知类别的样本训练集来设计分类器（监督学习）聚类：用事先不知类别的样本，利用样本的先验知识来构造分类器（无监督学习）聚类分析无训练过程，训练与识别混合在一起。相似性度量设有样本集，要求按某种相似性将其分类，怎样实现？聚类分析符合“物以类聚，人以群分“的原则，它把相似性大的样本聚集为一个类型，在特征空间里占据着一个局部区域。每个局部区域都形成一个聚合中心，聚合中心代表相应类型。如下图中，(a)有一个聚合中心，(b)、(c)有两个。聚类分析避免了估计类概率密度的困难，对每个聚合中心来说都是局部密度极大值位置，其附近密度高，距离越远密度越小。聚类分析的关键问题：如何在聚类过程中自动地确定类型数目c。实际工作中，也可以给定值作为算法终止的条件。聚类分析的结果与特征的选取有很大的关系。不同的特征，分类的结果不同。 1.距离相似性度量一个模式样本，对应特征空间里的一个点。如果模式的特征是适当选择的，也就是各维特征对于分类来说都是有效的，那么同类样本就会密集地分布在一个区域里，不同类的模式样本就会远离。因此，点间距离远近反映了相应模式样本所属类型有无差异，可以作为样本相似性度量。距离越近，相似性越大，属于一个类

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

聚类,模式识别.ppt