- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种改进的K近邻法在模式识别中的应用,模式识别k均值,k近邻算法,k近邻,k最近邻算法,k最近邻分类算法,k近邻法,k近邻算法代码matlab,k近邻分类算法,k近邻算法matlab
( )
第 25 卷 第 4 期 沈阳师范大学学报 自然科学版 Vol 25 , No. 4
( )
2007 年 10 月 Journal of S henyan g Norm al U niversity N atural Science Oct. 2007
( )
文章编号 : 1673 - 5862 2007 04 - 0475 - 04
一种改进的 K 近邻法在模式识别中的应用
周而重 , 逄玉俊
(沈阳化工学院 计算机科学与技术学院 , 辽宁 沈阳 110142)
摘 要 : 针对传统 K 近邻法的缺陷, 改进的 K 近邻法首先对训练样本进行聚类, 将样本的特
征空间划分成若干满足一定条件的小超球体, 然后依据最近间隔值在这些小超球体内搜索待分类
样本的 K 个近邻点 算法通过特征选取, 选出反映样本模式重要信息的特征, 从而确保了聚类的
·
质量 同时 K 近邻算法中引入的最近间隔值 ,既确定了近邻点的搜索半径 ,又保障了搜索的准确
·
性 通过实验证实 ,该方法不但节省时间 ,还有较高的识别率
· ·
关 键 词 : K 近邻法 ;聚类 ;特征选取
中图分类号: TP 391. 4 文献标识码 : A
0 引 言
K 近邻法是一种应用广泛的非参数分类方法, 可用于线性不可分的多类样本识别 它的优点是事
·
先并不要求知道待分样本的分布函数 目前广泛使用的 K 近邻法是以待分类样本为中心做超球体, 逐
·
渐扩大超球半径直至超球内包含 K 个已知模式样本为止, 判断这 K 个近邻样本中多数属于哪一类, 就
把待分类样本归为哪一类 分类算法描述如下[ 1] :
·
假设有 c 个类别 w 1 , w 2 , …, w c , i = 1 , 2 , …, c 测试样本 x 和与其最近的样本之间的距离为 g i ( x)
·
k k
= min x - x i , k = 1 , 2 , …, n i , 其中 x i 的下标i 表示 w i 类, 上标 k 表示 w i 类 n i 个样本中第 k 个样本 ·
k
在超球半径 r ≥min g i ( x) 的前提下, 求 L = argmax k i , k i (0 i c + 1) 表示这 k 个近邻中属于 w i 的样
i
本数 ·
上述方法的弱点就是, 半径 r 的选取十分困难 r 值过大, 超球体的覆盖面积广, 会导致其他类样本
·
被错误的覆盖, 从而加大样本的误识率 反之若 r 值过小, 则不能完全覆盖该类别中可能的样本点[ 1]
· ·
并且近邻点具有相似的预测值,
文档评论(0)