- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于特征熵相关度差异的KNN算法.pdf
第 37卷第 17期
Vo1.37 NO.17
计算机工程
Computer Engineering
2011 茸 9 月
September 2011
·人工智能及识到技术· 文章剿号I 1创协-3428(2011)17-014←-?3 文醺标识码I A 申团分号I TP181
基于特征煽相关度差异的 KNN 算法
周精,划胜
(广东石油化工学院计算机与电子信息学院,广东茂名 525αm
摘要z 传统 K 最近邻(KNN)法在进行样本分类时容易产生无法判断或判断错误的问题。为此,将特征销与 KNN 相结合,提出一种新的
分类算法(FECD-阳问。该算法采用销作为类相关度,以其差异值计算样本距离。用娟理论规约分类栩关度,并根据相关度间的差异值衡
量特征对分类的影响程度,从而建立距离测度与类别间的内在联系。仿真实验结果表明,与 KNN 及 Entropy-KNN 法相比,盹CD-KNN 在
保持效率的情况下,能够提高分类准确性。
关键词:K 最近邻算法;销;相关度;差异
KNN Algorithm ?ased on Feature Entropy Correlation Difference
ZHOU Jing, LIU Jin-sheng
(College of Computer姐d Electronic Information, Guangdong University of P,础。chemìca1 Technology. Maoming 525创)().C屈na)
IAbstractl The pa阳 ameliorates 也鹏也叫出at ∞时inlωK刹earest Neighbor(KNN) wi也 entropy. a new improved a1gori由n 也很 adopting
entropyas ∞,rrelation and taking differenαlS valuesωcalculate distance is proposed. which ca11s FECD-KNN. b部ed on 也.e re能缸ch 也at KNN
能sted sample in mì斗udgment and error easily. The imp也ted a1gori由m combines information en町opy 也ωry usedωstatute correlation. measures
strength of impact on 也e classification accordingωdiff町ence of correlation. and estabüshes the intrinsic relation between 由e distanωand class.
The contrast simulation experiment shows that. ∞mpared with KNN and En町opy-KNN. 由eimp,缸他d a1gorithm adopting the degree of c创relationω
optimìze distance raised 也e rate of accuracy enormously in classification. meanwhi1e it a1so maintains e任iciency of cl创S泊cation.
IKeyworl也I K-Nearest Neighbor(KNN) a1gori也m; entropy; correlation; difference
DOI: 10.3969/j.issn.1000-3428.2011.l7.049
1 概远
K 最近邻(K-Nearest Neighbor. KNN)法是最著名的模式
识别统计学方法之一IIl,凭借在分类过程中优良的健壮性、
稳定性及实现方法的简单性,广泛应用于数据挖掘、图像处
理等领域。但由于 KNN 的适用前提仅局限于样本数目较大、
局部近邻区域类条件概率相同的情况lll,其分类精度仍有待
提高。娟是对信息不确定因素的反映,将情运用于 KNN 算
法的思路颇具启发性。文献[2]将条件属性的信息精益作为裁
剪特征维数的依据,并根据保留下来的条件属性相关度大小
为其赋予相应的权重,结合欧式距离公式加权计算样本间的
距离。这类方法不足之处在于如果样本特征维数裁剪过多,
势必会引起分类准确率的下降,同时由于信息增益、欧式距
离机制的计算过程相对繁琐,该算法的分类计算量也相对较
大。文献[3J提出一种基于相同特征信息娟的类可信度计算方
法(Entropy-剧N),利用娟的大小确定样本间相同特征对分类
的重要性,并通过类可信度值对丰非本
您可能关注的文档
最近下载
- 迈富时 上市招股说明书.pdf VIP
- 年产3500吨对羟基苯甲酸乙酯(食品添加剂)项目可行性研究报告.docx VIP
- HMMT_-_哈佛-MIT数学竞赛题.pdf
- 资金平衡表.doc VIP
- 小学生四年级上册暑假练字电子字帖生字写字表提前学习练习楷书字帖pdf可打印文件.pdf VIP
- 氢氟酸安全标签.doc VIP
- 2025年全国统一高考生物试卷(江西卷)含答案 .pdf VIP
- 《义务教育数学课程标准(2022年版)》【试题】题库及答案汇总.docx VIP
- 八年级上册历史《中华民族的抗日战争》单元作业设计 (优质案例50页) .pdf VIP
- 商务日语函电第2课 支払い遅延の依頼と回答.ppt VIP
文档评论(0)