- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
课题名称
第3课用机器学习解决问题
课时目标
1.能够熟练完成从问题分析到数据收集、整理,再到模型训练、评估和应用的全过程。
2.学会根据不同问题特点选择合适的方法,熟练使用数据处理工具对数据清洗、整理和划分。
3.能依据具体问题,准确选择合适的机器学习算法,使用BaseML工具进行模型训练与优化。
4.能将训练好的模型与其他编程语言结合,开发出简单的AI应用,提升解决实际问题的能力。
教学准备
计算机、XEdu工具、相关数据集、教学课件
导学过程
意图说明
知识探究
1.项目子任务引入
——明确指出,本节课将深入学习如何利用机器学习技术解决真实问题,这是前面所学知识应用于实际的关键环节,也是完成项目任务的核心步骤,引导学生积极投入学习。
2.探究内容与要求
方法引导:采用案例驱动和实践操作相结合的方法,通过具体案例详细剖析每个环节的
操作要点和注意事项,让学生在实践中掌握用机器学习解决问题的方法。
(2)主要内容:
①哪些问题适合用机器学习解决?——问题分析与数据准备
②模型训练的关键要点有哪些?——模型训练和评估、优化
③模型应用的常见方式有哪些?——模型应用
3.知识习得
(1)自主阅读:引导学生以教材相关章节和XEdu工具的官方文档为主,网络资料作补充,自主阅读学习如何用机器学习解决问题的相关知识。在学生阅读过程中,教师巡视并解答疑问,引导学生关注重点内容和关键操作步骤。
(2)知识梳理:通过提问、总结、填写表格等方式,帮助学生梳理知识要点。例如,设计如下表格让学生填写:
学习内容
具体要点
问题分析方法
判断问题是否适合机器学习的依据:
1.问题是否存在规律,如变量之间是否有潜在关联。
2.能否获取相关的数据,数据的可收集性是关键。
3.问题的复杂程度,简单的线性问题更适合基础算法,复杂问题可能需要更高级的算法。
数据收集方法
“身高推断”适用方法:
1.在线调查:设计问卷收集身高、脚长、体重等相关信息。
2.直接测量:对身边人群进行实地测量获取数据。
“预测商品销量”适用方法:
1.企业内部销售记录收集:获取本企业商品的历史销售数据。
2.网络数据抓取:利用爬虫技术收集电商平台上同类商品的销售数据、价格等信息。
数据整理操作
数据整理的目的:
1.保证数据完整性:识别和处理数据集中的缺失值。
2.确保数据统一性:所有数据遵循相同的格式和标准。
3.提高数据准确性:识别和校正数据中的错误或不合理的值。
“身高推断”数据整理具体操作:
1.检查体重、鞋码等数据,去除异常值(如体重过轻或过重、鞋码不符合常理的数据)。
2.填补缺失的身高或其他特征数据,可采用均值、中位数等方法。
3.统一数据单位,如将身高的单位统一为厘米。
数据集划分工具
BaseDT工具函数:split_tab_dataset()
函数参数含义:
1.path:指定待拆分的CSV数据集路径。
2.data_column:用于指定特征数据列,以范围或具体列号表示。
3.label_column:指定标签列,即预测目标所在列。
4.train_val_ratio:设定训练集和验证集的拆分比例。
模型训练要点
高质量数据集的要求:
1.尽量避免错误:错误数据会严重影响模型训练效果。
2.数据量要大:数据量过少难以训练出准确的模型。
3.数据要尽可能扩大覆盖面:如预测身高不能仅用某一年龄段或某一地区的数据。
选择算法考虑因素:
1.任务类型:回归任务还是分类任务。
2.数据特点:如数据的线性关系、数据维度、数据量大小等。
3.算法的复杂度和可解释性:复杂算法可能精度高但难以解释,简单算法则相反。
模型评估指标
常用评估指标:
1.?值(决定系数)
2.均方误差(MSE)
指标含义:
1.?值:取值在0和1之间,越接近1说明模型对数据的拟合效果越好,模型与实际数据的相关性越高;越接近0说明模型效果越差,与实际数据相关性低。
2.均方误差:衡量预测值与真实值之间的平均误差平方,值越小,说明模型预测结果越接近真实值,模型的预测精度越高。
核心素养培育
(1)学会分析:给出一些实际问题,如预测学生的考试成绩提升情况、分析客户的购买偏好等,让学生分析这些问题是否适合用机器学习解决,以及如何进行数据准备、选择合适的算法和评估模型。引导学生从问题的性质、数据的可获取性、算法的适用性等方面进行分析,培养学生分析问题的能力。
(2)学会探究:探究如何训练回归模型推断人体身高并搭建一个身高推断系统。
①复制“身高推断系统”文件夹到XEDU教学资源目录下,使用Jupyter打开3.训练回归模型推断人体身高并搭建一个身高推断系.ipynb文件;
②读取数据并查看,拆分训练集、测试集,选择不同的算法
您可能关注的文档
- 清华大学版(2024)(青海)八下信息科技 第1单元 第1课 人工智能的起源与发展 教学设计.docx
- 清华大学版(2024)(青海)八下信息科技 第1单元 第1课 人工智能的起源与发展 课件.pptx
- 清华大学版(2024)(青海)八下信息科技 第1单元 第2课 认识机器学习 教学设计.docx
- 清华大学版(2024)(青海)八下信息科技 第1单元 第2课 认识机器学习 课件.pptx
- 清华大学版(2024)(青海)八下信息科技 第1单元 第3课 用机器学习解决问题 课件.pptx
- 清华大学版(2024)(青海)八下信息科技 第1单元 第4课 跨学科活动:身高推断 教学设计.docx
- 清华大学版(2024)(青海)八下信息科技 第1单元 第4课 跨学科活动:身高推断 课件.pptx
- 清华大学版(2024)(青海)八下信息科技 第2单元 第1课 神经网络与深度学习 教学设计.docx
- 清华大学版(2024)(青海)八下信息科技 第2单元 第1课 神经网络与深度学习 课件.pptx
- 清华大学版(2024)(青海)八下信息科技 第2单元 第2课 卷积神经网络及其应用 教学设计.docx
最近下载
- 副总经理岗位竞聘演讲稿范文.pptx
- 2025-2030年网络培训行业市场调研及前景趋势预测报告.docx
- 部编版小学道德与法治五年级下册《推翻帝制 民族觉醒》课件.ppt
- (正式版)-B 11291.2-2013 机器人与机器人装备 工业机器人的安全要求 第2部分:机器人系统与集成.docx VIP
- 长城汽车股份有限公司-H股2024年招聘172人公开引进高层次人才笔试参考题库(共100题)答案王牌.docx VIP
- 天津大学物理光学.ppt VIP
- 2023-2024年长城汽车股份有限公司招聘80人历年高频考题难、易错点模拟试题附带答案题库大全及答.docx VIP
- 紫色赛博朋克风重庆城市介绍.pptx
- Danfoss丹佛斯Scroll compressors VCH115 应用指南.pdf
- 2024以强国复兴有我为主题团课的演讲稿(通用12篇).docx VIP
文档评论(0)