- 17
- 0
- 约4.95千字
- 约 38页
- 2017-05-31 发布于湖北
- 举报
7.近邻法(2学时)概要
* 4. 压缩近邻法 * 【问题的提出】 剪辑近邻法所得到的剪辑样本集在样本数量的压缩方面并不十分明显,它的作用在于将原样本集中处于边界处样本删除掉,但靠近两类中心大部分样本仍被保留下来。 按近邻规则来看,这些样本中的大多数对分类决策没什么用处,如能在剪辑的基础上再去掉一部分这样的样本,将有助于进一步缩短计算时间与压缩存储量,这种方法称为压缩近邻法。 * 【基本思想】 压缩近邻法压缩样本的思想很简单,它利用现有样本集,逐渐生成一个新的样本集。使该样本集在保留最少量样本的条件下, 仍能对原有样本的全部用最近邻法正确分类,那末该样本集也就能对待识别样本进行分类, 并保持正常识别率。 该算法的作法也十分简单,它定义两个存储器,一个用来存放即将生成的样本集,称为Store;另一存储器则存放原样本集,称为Grabbag。 * 【步骤】 1.[初始化] Store是空集,原样本集存入Grabbag;从Grabbag中任意选择一样本放入Store中作为新样本集第一个样本。 2.[样本集生成] 在Grabbag中取出第i个样本用Store中的当前样本集按最近邻法分类。若分类错误,则将该样本从Grabbag转入Store中,若分类正确,则将该样本放回Grabbag中,对Grabbag中所有样本重复上述过程。 3
原创力文档

文档评论(0)