哈工大模式识别第四章第五章.ppt

哈工大模式识别第四章第五章

* (5) 对于所有的j,若ek≤ej (表明ekei)则将y从wi移到 wk中(否则, eiei ,不用移) (6) 重新计算mi和mk,并修改Jc 。 (7) 若连续迭代N次(即所有样本都运算过) Jc不变,则停止,否则转到2。    * 确定类别数的实验方法 上述C—均值算法都是在类别c已知条件下进行的。 在类别数未知情况下,可以假设类别数是逐步增加的,准则函数随c的增加而单调地减小。可选择平缓时转折处的C值。 * 5.3.1.3 ISODATA算法   C—均值算法比较简单,但它的自我调整能力也比较差。这主要表现在类别数不能改变,受代表点初始选择的影响也比较大。 全称‘迭代自组织数据分析技术’(Iterative Self-Organizing Data Analysis Technique Algorithm)。 ISODATA算法的功能与C—均值算法相比的改进。 1. 不是每调整一个样本的类别就重新计算一次各类均值(逐个样本修正),而是每次把全部样本都调整完毕后再重新计算样本均值(成批样本修正) 。 2.考虑了类别的合并与分裂,因而有了自我调整类别数的能力。从而可以得到较为合理的类别数。  * 5.3.2 分级聚类方法 分级聚类方法的目的并不把N个样本分成某一个预定的类别数C,而是把样本集按不同的相似程度要求分成不同类别的聚类。 最极端的情况: (1)每个

文档评论(0)

1亿VIP精品文档

相关文档