- 1、本文档共97页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据观察数据转换KNN模型训练模型保存KNN模型预测参考书目《机器学习技术任务驱动式教程》基于K-最近邻的分类预测模块3机器学习技术
目录电影类型预测鸢尾花种类预测葡萄酒品种预测小结习题三基于K-最近邻的分类预测模块3机器学习技术
数据集film.csv记录6部电影的肢体冲突镜头数、拥抱镜头数,以及电影评估类型。详细的字段描述见下表。1.1任务描述1电影类型预测有一部未看过的电影【肢体冲突镜头=18、拥抱镜头=90】,预测该电影是爱情片还是动作片。任务目标字段字段类型允许为空标签?例子电影名称string否否CaliforniaMan肢体冲突镜头Int否否3拥抱镜头int否否81影片类型int否是{1:爱情片,0:动作片}
1电影类型预测1.2任务分解import方式引入依赖的模块检查样本分布、特征/标签类型、空值、重复行、属性相互关系可视化样本的空间分布、待测试样本和训练样本的空间关系依赖库导入数据探查数据可视化从探查数据内容开始,经过分析数据分布,使用KNN模型找到标签和数据特征之间的关系,然后利用KNN模型预测未看过的电影。
1电影类型预测1.2任务分解转换Pandas类型到Numpy类型在已知样本上训练KNN模型用训练的模型预测电影【肢体冲突镜头=18、拥抱镜头为90】的类型数据转换模型训练预测接上
1电影类型预测1.3任务实施使用Python编程时,没必要实现所有的功能,可以借助Python自身的标准库或者其他人提供的第三方库。比如,本任务会使用到KNeighborsClassifier类,它位于sklearn.neighbors模块中,只需要将此模块导入到Jupyter程序中,就可以调用此函数。fromsklearn.neighborsimportKNeighborsClassifier
1电影类型预测1.3任务实施1.3.1依赖库导入步骤1:定义2级标题。##fontcolor=black依赖库导入/font按“SHIFT+Enter”,运行结果如下:
1电影类型预测1.3任务实施步骤2:导入依赖库。importpandasaspdimportmatplotlib.pyplotaspltimportmatplotlibasmplfromsklearn.neighborsimportKNeighborsClassifier按“SHIFT+Enter”,检查输出无异常。
1电影类型预测1.3任务实施1.3.2数据探查文件读入DataFrame对象后,需要观察不同标签的数据特征。步骤1:定义2级标题。##fontcolor=black数据探查/font按“SHIFT+Enter”,运行结果如下:
1电影类型预测1.3任务实施步骤2:对齐列名和数据。pd.set_option(display.unicode.ambiguous_as_wide,True)pd.set_option(display.unicode.east_asian_width,True)按“SHIFT+Enter”,检查输出无异常。
1电影类型预测1.3任务实施步骤3:读入数据集文件到DataFrame对象。url=“../data/film.csv”df=pd.read_csv(url,names=[“电影名称”,“电影类型”,“肢体冲突镜头”,“拥抱镜头])按“SHIFT+Enter”,检查输出无异常。
1.3CSVCSV(逗号分隔值文件格式)逗号分隔值(Comma-SeparatedValues,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号)文件以纯文本形式存储表格数据(数字和文本)。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。建议使用EXCEL或Notepad打开和保存CSV文件。
1电影类型预测1.3任务实施步骤4:显示爱情片样本。print(爱情片数据:\n,df[df[电影类型]==1])按“SHIFT+Enter”,运行结果如下:
1电影类型预测1.3任务实施步骤5:显示动作片样本。print(动作片数据:\n,df[df[电影类型]==0])按“SHIFT+Enter”,运行结果如下:
1电影类型预测1.3任务实施1.3.3数据可视化在3个特征中,“电影名称”内容是文本,无法映射到枚举类型,因而不予考虑,只需要观察“肢体冲突镜头”、“拥抱镜头”2个特征与标签“电影类型”的关系。步骤1:定义2级标题。##fontcolor=black数据可视化/font按“SHIFT+Enter”,运
您可能关注的文档
- 数据库应用基础(Access 2016) 赵增敏 习题答案.docx
- 《机器学习技术任务驱动式教程》习题答案汇总 第1--10章 .docx
- 机器学习技术任务驱动式教程-课件 模块1 了解机器学习.pptx
- 机器学习技术任务驱动式教程-课件 模块2 机器学习开发环境安装及使用.pptx
- 机器学习技术任务驱动式教程-课件 模块4 线性回归和逻辑回归预测.pptx
- 机器学习技术任务驱动式教程-课件 模块5 基于决策树的分类预测.pptx
- 机器学习技术任务驱动式教程-课件 模块6 基于贝叶斯理论的分类预测.pptx
- 机器学习技术任务驱动式教程-课件 模块7 基于支持向量机的分类预测.pptx
- 机器学习技术任务驱动式教程-课件 模块8 基于K-均值的聚类.pptx
- 机器学习技术任务驱动式教程-模块9 基于集成学习的分类预测.pptx
最近下载
- 血液透析患者高血压的治疗(2020年版血液净化标准操作规程).pdf
- 年春节安全生产开工第一课培训课件内容.pptx VIP
- (6篇)带头严守政治纪律和政治规矩,维护党的团结统一等四个方面存在的问题与整改材料.docx VIP
- 2025年江西水利职业学院单招职业技能测试题库附答案.docx VIP
- 2025年江西水利职业学院单招职业技能测试题库及答案(名师系列).docx VIP
- 人参商品课件.ppt
- 浙江理工大学2020-2021年度大学物理期末考试试卷及答案.pdf
- 品质异常处理流程培训.pptx VIP
- (2025春新版本)部编版七年级语文下册全册PPT课件.pptx
- 2024年江西水利职业学院单招职业技能测试题库及答案解析.docx VIP
文档评论(0)