- 4
- 0
- 约1.94千字
- 约 18页
- 2017-11-25 发布于河北
- 举报
KNN算法浅析
浅谈K-NN算法
目录
算法简介
算法思想
算法实现
算法应用场面或场景
算法的应用案例
一、算法简介
何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:分析一个人时,我们不妨观察和他最亲密的几个人。同理的,在判定一个未知事物时,可以观察离它最近的几个样本,这就是 kNN(k最近邻)的方法。
二、算法思想
如上图所示,有两类不同的样本数据,分别用蓝色的小正方形和红色的小三角形表示,而图正中间的那个绿色的圆所标示的数据则是待分类的数据。
问题:图中的绿色的圆属于哪一类?
如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。
如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于蓝色的正方形一类。
三、算法实现
产生训练集,使得训练集按照已有的分类标准划分成离散型数值类,或者是连续型数值类输出。
以训练集的分类为基础,对测试集每个样本寻找K个近邻,采用欧式距离作为样本间的相似程度的判断依据,相似度大的即为最近邻。一般近邻可以选择1个或者多个。
当类为连续型数值时,测试样本的最终输出为近邻的平均值;当类为离散型数值时,测试样本的最终为
您可能关注的文档
最近下载
- Haier海尔空调RFC140MXSAVC(F)说明书使用安装手册参数图解图电子版.pdf VIP
- 2025年江苏省机关事业单位工勤技能岗位技术等级考试(行政事务·高级技师)历年参考题库含答案详解.docx VIP
- NB-T 47004.1-2025-板式热交换器第1部分:可拆卸板式热交换器标准研究报告.docx
- 2025年中级消防设施操作员(监控类)资格理论必背考试题库(含答案).docx
- 湖南省有色新田岭钨业有限公司(四矿段).doc VIP
- 乡(镇)土地利用总体规划编制规程.pdf VIP
- 成都市双流区2025年社区专职网格员考试题库及答案.docx VIP
- 电力建设施工质量验收规程 第2部分:锅炉机组2018版.docx VIP
- 人教PEP三年级下册英语期末测试卷2套(含MP3听力材料+答案).pdf VIP
- 100MW∕200MWh储能电站项目可行性研究报告.doc VIP
原创力文档

文档评论(0)