模式识别-第13讲-非监督学习方法.pptVIP

  • 4
  • 0
  • 约7.37千字
  • 约 61页
  • 2016-12-30 发布于重庆
  • 举报
* * 【动态聚类】 C 均值聚类方法用于非监督模式识别的问题: 1. 要求类别数已知; 2. 是最小方差划分,并不一定能反映内在分布; 3. 与初始划分有关,不保证全局最优。 C 均值算法 * 在类别数未知情况下使用C—均值算法时,可以假设类别数是逐步增加的,例如对c=1,2,3,…分别使用该算法。 准则函数 是随c的增加而单调地减少的。如果样本集的合理聚类数为c类,当类别数继续增大时,相当于将聚类很好的类别又分成子类,则 值虽然继续减少但会呈现平缓趋势,如果作一条 值随c变化的曲线,则其拐点对应的类别数就比较接近于最优聚类数。 【C均值算法-类别数未知】 * 但是并非所有的情况都能找到明显的转折点。在无明显的转折点时,这种选择最佳分类数的方法将失效。一般需要利用先验知识对不同的聚类结果进行分析比较。 【C均值算法-类别数未知】 * C 均值算法比较简单,但它的自我调整能力也比较差。这主要表现在类别数必须事先确定,不能改变,这种主观确定数据子集数目并不一定符合数据集自身的特点,受代表点初始选择的影响也比较大。 类似于C 均值算法,ISODATA算法的聚类中心也是通过样本均值的迭代运算来决定。与C均值算法不同的是, ISODATA算法 将硬性确定聚类数目改成给出这个数目的期望值,作为算法的一个控制量。在算法中又加上分裂与合并机制,增加了一些试探性步骤和人机交

文档评论(0)

1亿VIP精品文档

相关文档