- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习徐国清KNN模型河南工业职业技术学院
KNNCover和Hart于1968年提出,理论上成熟,原理最简单。思路如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
KNN
KNN
K值选择如何确定K取多少值好呢?答案是通过交叉验证。做法将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,改变K值然后计算验证集合的方差,最终找到一个比较合适的K值。
K值选择需要安装scikit-learnPip或navigator在python中导入KNN的方法:fromsklearn.neighborsimportKNeighborsClassifier
K值选择sklearn.neighbors.KNeighborsClassifier的k-近邻算法使用介绍classsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,weights=’uniform’,algorithm=’auto’,leaf_size=30,
p=2,metric=’minkowski’,metric_params=None,n_jobs=None,**kwargs)
参数介绍n_neighborsint,默认值为5表示k-nn算法中选取离测试数据最近的k个点weightstrorcallable,默认值为uniform。表示k近邻点都分类结果的影响。uniform:表示所有点的权重相等distance:表示权重是距离的倒数,意味着k个点中距离近的点对分类结果的影响大于距离远的点[callable]:用户自定义函数,接受一个距离数组,返回一个同维度的权重数
参数介绍algorithm{ball_tree,kd_tree,brute,auto}计算找出k近邻点的算法ball_tree:使用BallTree维数大于20时建议使用kd_tree:使用KDTree,原理是数据结构的二叉树,以中值为划分,每个节点是一个超矩形,在维数小于20是效率高brute:暴力算法,线性扫描auto:自动选取最合适的算法
类的属性leaf_sizeint,默认值为30,用于构造BallTree和KDTreeleaf_size参数设置会影响树构造的树构造和询问的速度,同样也会影响树存储需要的内存,这个值的设定取决于问题本身。p:int,默认值为21:使用曼哈顿距离进行度量2:使用欧式距离进行度量
类的属性metric指定距离度量方法,一般都是使用欧式距离。euclidean:欧式距离?manhattan:曼哈顿距离?chebyshev:切比雪夫距离?minkowski:闵可夫斯基距离,默认参数n_jobs指定多少个CPU进行运算,默认是-1,也就是全部都算。
方法fit(X,y):使用X作为训练数据和y作为目标值拟合模型。get_params([deep]):获取此估计量的参数。kneighbors([X,n_neighbors,return_distance]):查找点的K邻居。查找点的K邻居。返回每个点的邻居的索引和与之的距离。kneighbors_graph([X,n_neighbors,mode]):计算X中点的k邻居的(加权)图。predict(X):预测提供的数据的类标签。predict_proba(X):测试数据X的返回概率估计。
方法score(X,y[,sample_weight]):返回给定测试数据和标签上的平均准确度。set_params(**params):设置此估算器的参数。
小结
机器学习徐国清KNN模型河南工业职业技术学院
您可能关注的文档
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语24课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语36课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语41课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语47课件讲解.pptx
- PracticalEnglishforInternationalCruiseShipCrew国际邮轮服务英语48课件讲解.pptx
- IO流概述罗祥裕96课件讲解.pptx
- IP数据报的转发52课件讲解.pptx
- Iterator接口赵耀宏16课件讲解.pptx
- Java语言的技术平台李冬29课件讲解.pptx
- Java语言发展历史李冬64课件讲解.pptx
- KNN应用案例机器学习07课件讲解.pptx
- Liaison用法解析容铭刚14课件讲解.pptx
- Linux系统管理5基本磁盘和逻辑卷的管理RedHatEnterpriseLinux80RHEL8015课件讲解.pptx
- Linux系统管理6软件包服务和进程的管理RedHatEnterpriseLinux80RHEL8040课件讲解.pptx
- Linux系统管理7网络配置与Firewalld防火墙的管理RedHatEnterpriseLinux80RHEL8042课件讲解.pptx
- Linux系统管理9使用DHCP动态分配主机地址RedHatEnterpriseLinux80RHEL8037课件讲解.pptx
- Linux系统管理11使用Apache部署Web网站RedHatEnterpriseLinux80RHEL8010课件讲解.pptx
- Linux系统管理12使用MariaDB管理数据库RedHatEnterpriseLinux80RHEL8074课件讲解.pptx
- Linux系统管理13使用vsftpd传输文件RedHatEnterpriseLinux80RHEL8096课件讲解.pptx
- Linux系统管理15综合案例校园网搭建RedHatEnterpriseLinux80RHEL8064课件讲解.pptx
原创力文档


文档评论(0)