模式识别-第13讲-非监督学习方法.pptVIP

下载本文档

4
0
约7.37千字
约 61页
2016-12-30 发布于重庆
举报

模式识别-第13讲-非监督学习方法.ppt

* * 【动态聚类】 C 均值聚类方法用于非监督模式识别的问题： 1. 要求类别数已知； 2. 是最小方差划分，并不一定能反映内在分布； 3. 与初始划分有关，不保证全局最优。 C 均值算法 * 在类别数未知情况下使用C—均值算法时，可以假设类别数是逐步增加的，例如对c＝1，2，3，…分别使用该算法。准则函数是随c的增加而单调地减少的。如果样本集的合理聚类数为c类，当类别数继续增大时，相当于将聚类很好的类别又分成子类，则值虽然继续减少但会呈现平缓趋势，如果作一条值随c变化的曲线，则其拐点对应的类别数就比较接近于最优聚类数。【C均值算法-类别数未知】 * 但是并非所有的情况都能找到明显的转折点。在无明显的转折点时，这种选择最佳分类数的方法将失效。一般需要利用先验知识对不同的聚类结果进行分析比较。【C均值算法-类别数未知】 * C 均值算法比较简单，但它的自我调整能力也比较差。这主要表现在类别数必须事先确定，不能改变，这种主观确定数据子集数目并不一定符合数据集自身的特点，受代表点初始选择的影响也比较大。类似于C 均值算法，ISODATA算法的聚类中心也是通过样本均值的迭代运算来决定。与C均值算法不同的是， ISODATA算法将硬性确定聚类数目改成给出这个数目的期望值，作为算法的一个控制量。在算法中又加上分裂与合并机制，增加了一些试探性步骤和人机交

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

模式识别-第13讲-非监督学习方法.pptVIP