大工20春《数据挖掘》课程大作业满分答案.pdf

大工20春《数据挖掘》课程大作业满分答案.pdf

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大工20春《数据挖掘》课程大作业满分

答案

网络教育学院《数据挖掘》课程大作业

题目:KNN算法原理及Python实现

姓名:

研究中心:

第一大题:

数据挖掘》是一门实用性非常强的课程,数据挖掘是大数

据这门前沿技术的基础,拥有广阔的前景,在信息化时代具有

非常重要的意义。数据挖掘的研究领域非常广泛,主要包括数

据库系统、基于知识的系统、人工智能、机器研究、知识获取、

统计学、空间数据库和数据可视化等领域。在研究过程中,我

也遇到了不少困难,例如基础差,对于Python基础不牢,尤

其是在进行这次课程作业时,显得力不从心;个别算法也研究

的不够透彻。在接下来的研究中,我仍然要加强理论知识的研

究,并且在研究的同时联系实际,在日常工作中注意运用《数

据挖掘》所学到的知识,不断加深巩固,不断发现问题,解决

问题。另外,对于自己掌握不牢的知识要勤复,多练,使自己

早日成为一名合格的计算机毕业生。

第二大题:

KNN算法介绍

KNN算法,又叫K最邻近分类算法,是数据挖掘分类技

术中最简单的方法之一。所谓K最近邻,就是k个最近的邻

居的意思,说的是每个样本都可以用它最接近的k个邻居来代

表。KNN算法的基本思路是:如果一个样本在特征空间中的

k个最相似(即特征空间中最邻近)的样本中的大多数属于某

一个类别,则该样本也属于这个类别。

KNN算法流程

1.计算测试数据与各个训练数据之间的距离;

2.按照距离的递增关系进行排序;

3.选取距离最小的K个点;

4.确定前K个点所在类别的出现频率;

5.返回前K个点中出现频率最高的类别作为测试数据的预

测分类。

Python实现算法及预测

在Python中,我们可以使用sklearn库来实现KNN算法。

具体实现代码如下:

python

fromsklearn.neighborsimportKNeighborsClassifier

knn=KNeighborsClassifier(n_neighbors=k)

knn.fit(X_train。y_train)

y_pred=knn.predict(X_test)

其中,k表示KNN算法中的k值,X_train和y_train分别

表示训练数据的特征和类别,X_test表示测试数据的特征,

y_pred表示预测的分类结果。

作业提交

完成作业后,将文件命名为[姓名奥鹏卡号研究中心](如:

戴卫东xxxxxxxx3979浙江台州奥鹏研究中心[1]VIP),并以

附件形式上交离线作业。注意,独立完成作业,不准抄袭其他

人或者请人代做,如有雷同作业,成绩以零分计!

KNN算法是一种基于样本空间的分类算法。它通过计算

待分类数据与已知样本之间的距离,找出与自己最接近的K

个样本,由这K个样本投票决定待分类数据归为哪一类。由

于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类

域的方法来确定所属类别的,因此对于类域的交叉或重叠较多

的待分样本集来说,kNN方法较其他方法更为适合。

KNN算法的流程如下:

1、计算测试数据与各个训练数据之间的距离

2、按照升序(从小到大)对距离(欧氏距离)进行排序

3、选取距离最小的前k个点

4、确定前k个点所在类别出现的频率

5、返回前k个点中出现频率最高的类别作为测试数据的

分类。

下面是Python实现KNN算法的代码:

python

importnumpyasnp

importnsascs

data=np.array([

71,3]

feature。=data[:,0]#特征

label=data[:,-1]#结果分类

predictPoint=200#预测数据

distance=list(map(lambdax:abs(predictPo

文档评论(0)

jichuxunlian3 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档