- 4
- 0
- 约2.15千字
- 约 5页
- 2022-06-11 发布于四川
- 举报
第4章pandas进阶教案
课程名称:Python机器学习编程与实战课程类别:必修
适用专业:大数据技术类相关专业总学时:64学时(其中理论36学时,实验28学时)
总学分:4.0学分本章学时:8学时
一、材料清单(1)《Python机器学习编程与实战》教材。
(2)配套 PPT。
(3)数据(4)代码
(5)引导性提问。
(6)探究性问题。
(7)拓展性问题。
二、教学目标与基本要求.教学目标
介绍文本文件,Excel数据和数据库数据三种常用的数据读取与写入方式。介绍 DataFrame的常用描述性统计分析方法。介绍时间序列的移动窗口方法。剖析分组聚合方法 groupby的原理,用法和三种分组计算方法。展现透视表与交叉表的制作方法。介绍缺失值 与重复数据的检测和处理方法。介绍连续型数据离散化的方法和类别型数据的哑变量处理方 法。为使用pandas进行机器学习中的数据准备工作打下基础。
.基本要求(1)掌握常见的数据读写方式。
(2)掌握常用的描述性统计分析方法。
(3)掌握移动窗口的方法。
(4)掌握分组聚合的原理与方法。
(5)掌握透视表与交叉表的制作。
(6)掌握缺失值与重复数据的检测和处理方法。
(7)掌握连续型数据离散化的方法。
(8)掌握哑变量处理类别型数据的方法。
三、问题
.引导性提问
引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问
原创力文档

文档评论(0)