- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《Python数据分析与机器学习》课程教学大纲一、课程基本信息
课程名称:Python数据分析与机器学习学分:2、3、4
课时:32、48、64二、课程目标
本课程采用理论与实践相结合的教学方式,通过学习Python语法 基础、numpy数据处理、matplotlib数据可视化技术、pandas数据预处 理与分析技术、sklearn机器学习等内容,培养学生数据处理的能力, 掌握机器学习的基本流程,并能够利用机器学习的方法挖掘数据中的 有用价值,使学生更好地适应大数据和人工智能时代的工作与学习。
三、先修课程无
四、教材 杨年华,Python数据分析与机器学习,清华大学出版社,2022年9月
五、课程内容1、Python语言与开发环境概述(2课时)
(1)Python语言的特点、下载与安装、交互与文件两种使用方式。
(1课时)
(2)代码的风格、模块的概念及其导入方式、帮助的使用、Anaconda环境的安装与使用(1课时)
2、Python语言基础(8课时)
(1)控制台的输入与输出、标识符、变量、赋值语句(1课时)
(2)常用数据类型、运算符、表达式(1课时)
(3)分支结构(2课时)
(4)循环结构(1课时)
(5)常用组合类型(列表、元组、字符串、字典、集合)(2课时)
(6)推导式、用于组合类型的常用内置函数、正则表达式(1课时)3、函数(5课时)
(1)函数的定义、调用、函数的返回值、位置参数与关键参数(2课 时)
(2)默认参数、个数可变的参数、参数与返回值类型注解(2课时)
(3) lambda表达式、函数式编程的常用类与函数(1课时)4、自定义类与对象(3课时)
(1) Python中的对象与方法、类的定义与对象的创建(1课时)
(2)类的继承(2课时)5、numpy数据处理基础(6课时)
(1)numpy数据结构、数据的准备、数组的索引与切片(2课时)
(2)改变数组的形状、对角线上元素的替换、插入维度、数组的基本运算、数组的排序、数组的组合、数组的分割(2课时)
(3)随机打乱数组中的元素顺序、多维数组的展开、其他适用于数组 的函数与对象、利用numpy进行统计分析、数组在其他文件中的存取
(2课时)6、matplotlib数据可视化基础(6课时)
(1)绘制基本图形、绘制多轴图(2课时)
(2)坐标轴的刻度标签、主次刻度、网格设置、移动坐标轴、文字说 明和注释、显示图片、日期作为横坐标(2课时)
(3)绘制横线与竖线、绘制其他二维图表、绘制三维图表(2课时)7、pandas数据处理与分析(6课时)
(1)数据结构与基本操作、文件与数据库中存取DataFrame对象(2 课时)
(2)常用函数与方法(1课时)
(3) DataFrame数据清洗与处理、时间处理(2课时)
(4)移动数据与时间索引、统计分析、pandas中的绘图方法(1课 时)8、机器学习方法概述与数据加载(5课时)
(1)机器学习概述、sklearn简介与安装(1课时)
(2)加载数据、划分训练集与测试集(2课时)
sklearn中机器学习的基本步骤示例、sklearn编程接口风格(2课时)
9、数据预处理(3课时)
(1)特征的离散化(1课时)
(2)识别与处理异常值、特征的Min-Max缩放(1课时)
(3)特征值的标准化、特征值的鲁棒缩放、无序分类数据的热编码、有序分类数据的编码、每个样本特征值的正则化(1课时)
10、模型评估与轨道(4课时)
(1)泛华、过拟合、欠拟合的概念;模型评估指标(2课时)
(2)交叉验证(1课时)
(3)轨道的创建与使用(1课时)11、有监督学习之分类与回归(6课时)
(1)分类与回归概述、线性回归(2课时)
(2)逻辑回归与岭回归实现线性分类、支持向量机用于分类和回归
(2课时)
(3)朴素贝叶斯分类、决策树用于分类和回归(2课时)12、集成学习(4课时)
(1)投票法集成、bagging/pasting集成(2课时)
(2)提升法集成、堆叠法集成(2课时)13、无监督学习之聚类与降维(4课时)
(1)用k-均值基于相似性聚类、层次聚类、基于密度的聚类(2课时)
(2)聚类性能评估、无监督的降维(2课时)14、超参数调优与模型选择(4课时)
(1)基于循环语句的网格搜索、划分验证集避免过拟合、带交叉验证的网格搜索、带交叉验证的随机搜索(2课时)
(2)搜索多个不同特征的空间、对轨道中的超参数进行搜索、搜索算法和超参数(2课时)
六、不同学分的课时与教学内容安排建议
序 号
章节名称
2学分 课时规 划
2学分 课时规 划
3学分 课时规 划
3学分 课时规 划
4学分课 时规划
1
Python语言与开发环境概 述
2
2
2
2
Python语言基础
8
6
8
3
函数
5
5
5
4
自定义类与对
文档评论(0)