KNN模型机器学习53课件讲解.pptxVIP

下载本文档

0
0
约1.63千字
约 15页
2026-01-13 发布于陕西
举报
版权申诉

KNN模型机器学习53课件讲解.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习徐国清KNN模型河南工业职业技术学院

KNNCover和Hart于1968年提出，理论上成熟，原理最简单。思路如果一个样本在特征空间中的K个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

KNN

K值选择如何确定K取多少值好呢？答案是通过交叉验证。做法将样本数据按照一定比例，拆分出训练用的数据和验证用的数据，改变K值然后计算验证集合的方差，最终找到一个比较合适的K值。

K值选择需要安装scikit-learnPip或navigator在python中导入KNN的方法：fromsklearn.neighborsimportKNeighborsClassifier

K值选择sklearn.neighbors.KNeighborsClassifier的k-近邻算法使用介绍classsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,weights=’uniform’,algorithm=’auto’,leaf_size=30,

p=2,metric=’minkowski’,metric_params=None,n_jobs=None,**kwargs)

参数介绍n_neighborsint，默认值为5表示k-nn算法中选取离测试数据最近的k个点weightstrorcallable，默认值为uniform。表示k近邻点都分类结果的影响。uniform：表示所有点的权重相等distance：表示权重是距离的倒数，意味着k个点中距离近的点对分类结果的影响大于距离远的点[callable]：用户自定义函数，接受一个距离数组，返回一个同维度的权重数

参数介绍algorithm{ball_tree,kd_tree,brute,auto}计算找出k近邻点的算法ball_tree：使用BallTree维数大于20时建议使用kd_tree：使用KDTree，原理是数据结构的二叉树，以中值为划分，每个节点是一个超矩形，在维数小于20是效率高brute：暴力算法，线性扫描auto：自动选取最合适的算法

类的属性leaf_sizeint，默认值为30，用于构造BallTree和KDTreeleaf_size参数设置会影响树构造的树构造和询问的速度，同样也会影响树存储需要的内存，这个值的设定取决于问题本身。p：int，默认值为21：使用曼哈顿距离进行度量2：使用欧式距离进行度量

类的属性metric指定距离度量方法，一般都是使用欧式距离。euclidean：欧式距离?manhattan：曼哈顿距离?chebyshev：切比雪夫距离?minkowski：闵可夫斯基距离，默认参数n_jobs指定多少个CPU进行运算，默认是-1，也就是全部都算。

方法fit(X,y)：使用X作为训练数据和y作为目标值拟合模型。get_params([deep])：获取此估计量的参数。kneighbors([X,n_neighbors,return_distance])：查找点的K邻居。查找点的K邻居。返回每个点的邻居的索引和与之的距离。kneighbors_graph([X,n_neighbors,mode])：计算X中点的k邻居的（加权）图。predict(X)：预测提供的数据的类标签。predict_proba(X)：测试数据X的返回概率估计。

方法score(X,y[,sample_weight])：返回给定测试数据和标签上的平均准确度。set_params(**params)：设置此估算器的参数。

小结

机器学习徐国清KNN模型河南工业职业技术学院

您可能关注的文档

文档评论（0）

一笑倾洁 + 关注: 实名认证

文档贡献者

PPT课件

咨询Ta 进入空间

1亿VIP精品文档

更多 >

KNN模型机器学习53课件讲解.pptxVIP