哈工大模式识别第3章研讨.ppt

3.8.3.1 近邻法的快速算法 这种方法着眼于只解决减少计算量,但没有达到减少存储量的要求。 其基本思想是: 将样本集按邻近关系分解成组,给出每组的质心所在,以及组内样本至该质心的最大距离。 这些组又可形成层次结构,即组又分子组 因而待识别样本可将搜索近邻的范围从某一大组,逐渐深入到其中的子组,直至树的叶结点所代表的组,确定其相邻关系。 包括2个阶段:1.样本集分级分解;2. 搜索算法 样本集分级分解 3.8.3.2 剪辑近邻法 快速算法只是研究如何减少计算量的问题,而不考虑存储量的压缩。 实际上由于对样本进行分层次分组,并附有一些参数,实际的存储量还有可能增加。 本节讨论的算法着眼于如何减少模板样本数目,从而可同时减少分类时的计算量及模板样本的存储量,同时还能进一步改进分类器的性能,如降低错误率等要求。   剪辑近邻法的基本思想 近邻法分类的错误率产生的主要原因:作为识别用的参考样本集中,交迭区域中不同类别的样本彼此穿插。 如果能将交界处的样本以适当方式筛选,剪辑掉容易引起错分的样本,则可以实现既减少样本数又提高正确识别率的双重目的。 可以利用现有样本集对其自身进行剪辑。 本课程主要讨论两类样本的剪辑。 1、两分剪辑近邻法 1)将参考样本集AN (样本数量为N)分成两个互相独立的子集。 一个被当作考试集ANT ,另一个作为参考集ANR ,数量分别为NT与NR,NT+NR=N。

文档评论(0)

1亿VIP精品文档

相关文档