清华大学版（2024）（青海）八下信息科技第1单元第3课用机器学习解决问题教学设计.docxVIP

下载本文档

0
0
约2.64千字
约 3页
2025-03-06 发布于浙江
举报
版权申诉

清华大学版（2024）（青海）八下信息科技第1单元第3课用机器学习解决问题教学设计.docx

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

课题名称

第3课用机器学习解决问题

课时目标

1.能够熟练完成从问题分析到数据收集、整理，再到模型训练、评估和应用的全过程。

2.学会根据不同问题特点选择合适的方法，熟练使用数据处理工具对数据清洗、整理和划分。

3.能依据具体问题，准确选择合适的机器学习算法，使用BaseML工具进行模型训练与优化。

4.能将训练好的模型与其他编程语言结合，开发出简单的AI应用，提升解决实际问题的能力。

教学准备

计算机、XEdu工具、相关数据集、教学课件

导学过程

意图说明

知识探究

1.项目子任务引入

——明确指出，本节课将深入学习如何利用机器学习技术解决真实问题，这是前面所学知识应用于实际的关键环节，也是完成项目任务的核心步骤，引导学生积极投入学习。

2.探究内容与要求

方法引导：采用案例驱动和实践操作相结合的方法，通过具体案例详细剖析每个环节的

操作要点和注意事项，让学生在实践中掌握用机器学习解决问题的方法。

（2）主要内容：

①哪些问题适合用机器学习解决？——问题分析与数据准备

②模型训练的关键要点有哪些？——模型训练和评估、优化

③模型应用的常见方式有哪些？——模型应用

3.知识习得

（1）自主阅读：引导学生以教材相关章节和XEdu工具的官方文档为主，网络资料作补充，自主阅读学习如何用机器学习解决问题的相关知识。在学生阅读过程中，教师巡视并解答疑问，引导学生关注重点内容和关键操作步骤。

（2）知识梳理：通过提问、总结、填写表格等方式，帮助学生梳理知识要点。例如，设计如下表格让学生填写：

学习内容

具体要点

问题分析方法

判断问题是否适合机器学习的依据：

1.问题是否存在规律，如变量之间是否有潜在关联。

2.能否获取相关的数据，数据的可收集性是关键。

3.问题的复杂程度，简单的线性问题更适合基础算法，复杂问题可能需要更高级的算法。

数据收集方法

“身高推断”适用方法：

1.在线调查：设计问卷收集身高、脚长、体重等相关信息。

2.直接测量：对身边人群进行实地测量获取数据。

“预测商品销量”适用方法：

1.企业内部销售记录收集：获取本企业商品的历史销售数据。

2.网络数据抓取：利用爬虫技术收集电商平台上同类商品的销售数据、价格等信息。

数据整理操作

数据整理的目的：

1.保证数据完整性：识别和处理数据集中的缺失值。

2.确保数据统一性：所有数据遵循相同的格式和标准。

3.提高数据准确性：识别和校正数据中的错误或不合理的值。

“身高推断”数据整理具体操作：

1.检查体重、鞋码等数据，去除异常值（如体重过轻或过重、鞋码不符合常理的数据）。

2.填补缺失的身高或其他特征数据，可采用均值、中位数等方法。

3.统一数据单位，如将身高的单位统一为厘米。

数据集划分工具

BaseDT工具函数：split_tab_dataset()

函数参数含义：

1.path：指定待拆分的CSV数据集路径。

2.data_column：用于指定特征数据列，以范围或具体列号表示。

3.label_column：指定标签列，即预测目标所在列。

4.train_val_ratio：设定训练集和验证集的拆分比例。

模型训练要点

高质量数据集的要求：

1.尽量避免错误：错误数据会严重影响模型训练效果。

2.数据量要大：数据量过少难以训练出准确的模型。

3.数据要尽可能扩大覆盖面：如预测身高不能仅用某一年龄段或某一地区的数据。

选择算法考虑因素：

1.任务类型：回归任务还是分类任务。

2.数据特点：如数据的线性关系、数据维度、数据量大小等。

3.算法的复杂度和可解释性：复杂算法可能精度高但难以解释，简单算法则相反。

模型评估指标

常用评估指标：

1.?值（决定系数）

2.均方误差（MSE）

指标含义：

1.?值：取值在0和1之间，越接近1说明模型对数据的拟合效果越好，模型与实际数据的相关性越高；越接近0说明模型效果越差，与实际数据相关性低。

2.均方误差：衡量预测值与真实值之间的平均误差平方，值越小，说明模型预测结果越接近真实值，模型的预测精度越高。

核心素养培育

（1）学会分析:给出一些实际问题，如预测学生的考试成绩提升情况、分析客户的购买偏好等，让学生分析这些问题是否适合用机器学习解决，以及如何进行数据准备、选择合适的算法和评估模型。引导学生从问题的性质、数据的可获取性、算法的适用性等方面进行分析，培养学生分析问题的能力。

（2）学会探究：探究如何训练回归模型推断人体身高并搭建一个身高推断系统。

①复制“身高推断系统”文件夹到XEDU教学资源目录下，使用Jupyter打开3.训练回归模型推断人体身高并搭建一个身高推断系.ipynb文件；

②读取数据并查看，拆分训练集、测试集，选择不同的算法

您可能关注的文档

文档评论（0）

中小学教学资料 + 关注: 实名认证

服务提供商

提供小学、初中、高中信息科技教案、试卷、课件等优质教学资源

咨询作者（129人已咨询）已休息

1亿VIP精品文档

更多 >

清华大学版（2024）（青海）八下信息科技第1单元第3课用机器学习解决问题教学设计.docxVIP