- 369
- 0
- 约4千字
- 约 43页
- 2018-09-05 发布于天津
- 举报
KNN算法的重点近邻的距离度量表示法K值的选择K近邻算法的实现
K近邻算法,(K-Nearest Neighbor algorithm)简称KNN算法,给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例,这K个实例的多数属于某个类,就把该输入实例分类到这个类中。它是用于解决分类问题的算法。 KNN算法 KNN 算法的例子 有两类不同的样本数据,分别用蓝色的小正方形和红色的小三角形表示,而图正中间的那个绿色的圆所标示的数据则是待分类的数据。 如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。 如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,判定绿色的这个待分类点属于蓝色的正方形一类。 ? ? 于此我们看到,当无法判定当前待分类点是从属于已知分类中的哪一类时,我们可以依据统计学的理论看它所处的位置特征,衡量它周围邻居的权重,而把它归为(或分配)到权重更大的那一类。这就是K近邻算法的核心思想。 KNN算法的重点 邻近的判定标准是什么,用什么来度量。即近邻的距离度量表示法。 还有一个选择多少个邻居,即K值定义为多大的问题。 近邻的距离度量表示法 K近邻模型的特征空间一般是n维实数向量空间,使用的距离可以使欧式距离 欧式距离的计算公式: 也是可以是其它距
您可能关注的文档
- 同义词偏误产生原因.DOC
- 同一平面内的两条直线有几种位置关系.PPT
- 同课异构五彩纷呈-临河区第九小学.DOC
- 投标申请函-广州天河软件园.DOC
- 条件概率与概率的乘法公式.PPT
- 一道错解例题引发的探究性学习.DOC
- 万州经开区高峰生态工业园相思南区A区场平工程-万州区.DOC
- 中国社会主义经济法学理论框架已经构建.PPT
- 中国食品土畜进出口商会食用菌分会-第十二届中国蘑菇节.DOC
- 中国顶极域名注册协议-IDC前线.DOC
- CN119780238A 一种混凝土内部缺陷与密实性非破坏性检测方法及系统 (江苏捷达交通工程集团有限公司).pdf
- CN119780275A 一种乌司他丁的o-糖链的分析方法 (江苏艾迪药业股份有限公司).pdf
- 含德语区公会运营考点2026德语游戏客服面试题库答案.doc
- 2026年虚拟企业管理与企业经营决策模拟题库(附答案).pdf
- 2026检验检测机构内审全套资料.docx
- 2026年人脸识别技术应用创新报告及未来五至十年行业发展趋势报告.docx
- CN119780124A 电路板检测装置及方法 (深圳市利器精工科技有限公司).pdf
- 2026年工业5G工业应用创新报告.docx
- 数控车床培训教程_第2版_251-300.pdf
- 2026年中国汽车零部件焊接件数据监测研究报告.docx
原创力文档

文档评论(0)