KNN算法浅析.pptxVIP

  • 4
  • 0
  • 约1.94千字
  • 约 18页
  • 2017-11-25 发布于河北
  • 举报
KNN算法浅析

浅谈K-NN算法 目录 算法简介 算法思想 算法实现 算法应用场面或场景 算法的应用案例 一、算法简介 何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:分析一个人时,我们不妨观察和他最亲密的几个人。同理的,在判定一个未知事物时,可以观察离它最近的几个样本,这就是 kNN(k最近邻)的方法。 二、算法思想 如上图所示,有两类不同的样本数据,分别用蓝色的小正方形和红色的小三角形表示,而图正中间的那个绿色的圆所标示的数据则是待分类的数据。 问题:图中的绿色的圆属于哪一类? 如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。 如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于蓝色的正方形一类。 三、算法实现 产生训练集,使得训练集按照已有的分类标准划分成离散型数值类,或者是连续型数值类输出。 以训练集的分类为基础,对测试集每个样本寻找K个近邻,采用欧式距离作为样本间的相似程度的判断依据,相似度大的即为最近邻。一般近邻可以选择1个或者多个。 当类为连续型数值时,测试样本的最终输出为近邻的平均值;当类为离散型数值时,测试样本的最终为

文档评论(0)

1亿VIP精品文档

相关文档