- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 PAGE 1 页/共 NUMPAGES \* Arabic 5 页
《大数据挖掘与分析》课程教学大纲
课程编号:课程名称:大数据挖掘与分析/ data mining and Data analysis for big data
总学时/学分:40/2.5(其中理论32学时,实验8学时)
适用专业:计算机科学与技术
一、课程目标
通过本课程学习,学生应达到如下目标:
目标1:对应用场景,选择适合数据挖掘与分析数学模型。
目标2:对数学模型运用Python编程实现,分析结果,综合得到结论,形成报告。
二、教学过程安排
序号
知识模块
教学内容
课时
课程目标
教学方法
1
数据分析与挖掘概述
1.1 什么是数据分析和挖掘 1.2 数据分析与挖掘的应用领域 1.3 数据分析与挖掘的区别 1.4 数据挖掘的流程 1.5 常用的数据分析与挖掘工具
2
目标1
课堂讲授
2
从收入的预测分析开始
2.1 下载与安装Anoconda
2.2 基于Python的案例实战
2
目标1
课堂讲授
3
Python数值计算工具——Numpy
4.1 数组的创建与操作
4.2 数组的基本运算符
4.3 常用的数学和统计函数
4.4 线性代数的相关计算
4.5 伪随机数的生成
2
目标1
课堂讲授+演示+测验+作业
4
Python数据处理工具——Pandas
4.1 关系模式的设计与函数依赖
4.2 关系规范化
4.3模式分解
2
目标1
课堂讲授+演示+作业
5
Python数据可视化
6.1 离散型变量的可视化
6.2 数值型变量的可视化
6.3 关系型数据的可视化
6.4 多个图形的合并
2
目标1
课堂讲授+演示+作业
6
线性回归预测模型
7.1 一元线性回归模型
7.2 多元线性回归模型
7.3 回归模型的假设检验
7.4 回归模型的诊断
4
目标1
课堂讲授+演示+作业
7
岭回归与LASSO回归模型
8.1 岭回归模型
8.2 岭回归模型的应用
8.3 LASSO回归模型
8.4 LASSO回归模型的应用
2
目标1
课堂讲授+演示+作业
8
Logistic回归分类模型
9.1 Logistic模型的构建
9.2 分类模型的评估方法
9.3 Logistic回归模型的应用
2
目标1
课堂讲授+演示+作业
9
决策树与随机森林
10.1 节点字段的选择
10.2 决策树的剪枝
10.3 随机森林
10.4 决策树与随机森林的应用
4
目标1
课堂讲授+演示+作业
10
KNN模型的应用
11.1 KNN算法的思想
11.2 最佳k值的选择
11.3 相似度的度量方法
11.4 近邻样本的搜寻方法
11.5 KNN模型的应用
2
目标1
课堂讲授+演示+作业
11
SVM模型的应用
13.1 SVM简介
13.2 几种常见的SVM模型
13.3 分类问题的解决
13.4 预测问题的解决
2
目标1
课堂讲授+演示+作业
12
课内实验
实验1.numpy
实验2.pandas
实验3.数据分析和挖掘主要流程
实验4. 从电影评分预测理解机器学习基本概念
8
目标2
学生操作
教师指导
实验报告
13
大作业与讨论
以组为单位应用机器学习算法对某一应用场景的数据进行分析、预测
6
目标2
教师指导
学生调研写报告、讨论
三、实验或上机内容
序号
实验项目名称
实验目的和任务
实验学时
实验类型
开出要求
1
numpy
目的:通过实验,熟练掌握numpy数组创建、拆分、堆叠、基本运算、切片、索引等操作;
任务:numpy数组创建、拆分、堆叠、基本运算、切片、索引等操作 。
2
设计型
必做
2
pandas
目的:熟练掌握pandas的使用。
任务:Series、DataFrame的常用操作、读取csv格式数据、排序、删除、算术运算、去重、层次化索引。
2
设计型
必做
3
数据分析和挖掘主要流程
目的:数学数据分析与挖掘主要流程。
任务:使用scikit-learn导入数据集、数据标准化预处理、文本数据特征提取、使用scikit-learn分类器svm对digit数据进行分类;模型持久化,模型评估-量化预测效果。
2
设计型
必做
4
从电影评分预测理解机器学习基本概念
目的:理解机器学习基本概念。
任务:统计数据集基本属性、实现基础预测评分算法、应用模型做预测、评估机器学习模型、基于梯度下降法的模型参数估计。
2
设计型
必做
(实验类型:从“验证型、综合型、设计型、研究型”中选择一个,开出要求:从“必做、选做”中选择一个,如无“实验或上机内容”则填“无”,删除此表格)
四、课程目标达成方法
教学目标
课时
评价方法
评价依据
达成标准(分)
目标1
26
考试(60%)+
原创力文档


文档评论(0)