网站大量收购独家精品文档,联系QQ:2885784924

《机器学习与Python实践》课件_05决策树KNN.pptx

《机器学习与Python实践》课件_05决策树KNN.pptx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

01距离度量02KNN算法本章目录03KD树划分04KD树搜索

01距离度量02KNN算法03KD树划分04KD树搜索1.距离度量

距离度量欧氏距离(Euclideandistance)??电影分类

距离度量曼哈顿距离(Manhattandistance)?想象你在城市道路里,要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?显然不是,除非你能穿越大楼。实际驾驶距离就是这个“曼哈顿距离”。而这也是曼哈顿距离名称的来源,曼哈顿距离也称为城市街区距离(CityBlockdistance)。

距离度量切比雪夫距离(Chebyshevdistance)?二个点之间的距离定义是其各坐标数值差绝对值的最大值。国际象棋棋盘上二个位置间的切比雪夫距离是指王要从一个位子移至另一个位子需要走的步数。由于王可以往斜前或斜后方向移动一格,因此可以较有效率的到达目的的格子。上图是棋盘上所有位置距f6位置的切比雪夫距离。

距离度量闵可夫斯基距离(Minkowskidistance)??

距离度量汉明距离(Hammingdistance)?汉明距离是使用在数据传输差错控制编码里面的,汉明距离是一个概念,它表示两个(相同长度)字对应位不同的数量,我们以表示两个字之间的汉明距离。对两个字符串进行异或运算,并统计结果为1的个数,那么这个数就是汉明距离。

距离度量余弦相似度?

01距离度量02KNN算法03KD树划分04KD树搜索2.KNN算法

2.KNN算法??

2.KNN算法??

2.KNN算法算法流程如下:1.计算测试对象到训练集中每个对象的距离2.按照距离的远近排序3.选取与当前测试对象最近的k的训练对象,作为该测试对象的邻居4.统计这k个邻居的类别频次5.k个邻居里频次最高的类别,即为测试对象的类别K=3K=5

01距离度量02KNN算法03KD树划分04KD树搜索3.K-D-Tree划分

KD树划分??①?

KD树划分??①②②???

KD树划分??①②②③③?????????

KD树划分??①②②③③④?????????????

KD树划分?①③③④②②

KD树划分样本空间结构图?????????????

01距离度量02KNN算法03KD树划分04KD树搜索4.K-D-Tree搜索

KD树搜索1.首先要找到该目标点的叶子节点,然后以目标点为圆心,目标点到叶子节点的距离为半径,建立一个超球体,我们要找寻的最近邻点一定是在该球体内部。搜索(4,4)的最近邻时。首先从根节点(6,4)出发,将当前最近邻设为(6,4),对该KD树作深度优先遍历。以(4,4)为圆心,其到(6,4)的距离为半径画圆(多维空间为超球面),可以看出(7,2)右侧的区域与该圆不相交,所以(7,2)的右子树全部忽略。

KD树搜索2.返回叶子结点的父节点,检查另一个子结点包含的超矩形体是否和超球体相交,如果相交就到这个子节点寻找是否有更加近的近邻,有的话就更新最近邻。接着走到(6,4)左子树根节点(4,5),与原最近邻对比距离后,更新当前最近邻为(4,5)。以(4,4)为圆心,其到(4,5)的距离为半径画圆,发现(6,4)右侧的区域与该圆不相交,忽略该侧所有节点,这样(6,4)的整个右子树被标记为已忽略。

KD树搜索3.如果不相交直接返回父节点,在另一个子树继续搜索最近邻。4.当回溯到根节点时,算法结束,此时保存的最近邻节点就是最终的最近邻。遍历完(4,5)的左右叶子节点,发现与当前最优距离相等,不更新最近邻。所以(4,4)的最近邻为(4,5)。

参考文献[1]AndrewNg.MachineLearning[EB/OL].StanfordUniversity,2014./course/ml[2]李航.统计学习方法[M].北京:清华大学出版社,2019.[3]周志华.机器学习[M].北京:清华大学出版社,2016.[4]CoverTM,HartPE.Nearestneighborpatternclassification[J].IEEETrans.inf.theory,1953,13(1):21-27.[5]HastieT.,TibshiraniR.,FriedmanJ.TheElementsofStatisticalLearning[M].NewYork:Springer,2001.[6]CHRISTOPHERM.BISHOP.PatternRecognitionand

文档评论(0)

酱酱 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档