哈工大模式识别第四第五剖析.ppt

* 哈尔滨工业大学电信院 宿富林 * 例:各分量不同尺度对聚类的影响 * 哈尔滨工业大学电信院 宿富林 * 不同聚类算法的比较 间接的动态聚类算法: 优点:计算效率很高 其中,分级聚类算法比较适合于样本数较少的情况。 缺点:选定的模型常常不能反映数据的概率结构,得到的结果不能反映数据构造的真实情况。 只有通过选择各种各样的核函数以及分析这些核函数所得所到的聚类结果来部分地解决这个问题。 单峰子集类的分离法 优点:反映数据的概率结构 缺点:1)要对概率密度函数进行估计,计算量大。 2)在进行概率估计时要选定一些参数,估计的结果受到参数选择的较大影响。 3)在有噪声的情况下,具有局部最大值的概率密度函数的峰点都会发生变化,从而不能正确反映数据中的单峰子集数。 4)在样本数较少的情况下,由于没有可能对概率密度函数进行估计。这种方法完全失去意义。 * 哈尔滨工业大学电信院 宿富林 * * * 哈尔滨工业大学电信院 宿富林 * (e) 从c-1个聚类划分问题的解中产生C聚类划分问题的代表点 首先,将所有样本集看作一个聚类,计算其总均值,然后找与该均值相距最远的点,由该点及原均值点构成2聚类的代表点。 其次,依同

文档评论(0)

1亿VIP精品文档

相关文档