《大数据挖掘与分析》课程教学大纲.docxVIP

下载本文档

147
0
约4.16千字
约 5页
2021-10-13 发布于上海
举报
版权申诉

《大数据挖掘与分析》课程教学大纲.docx

此“教育”领域文档为创作者个人分享资料，不作为权威性指导和指引，仅供参考

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第 PAGE 1 页/共 NUMPAGES \* Arabic 5 页《大数据挖掘与分析》课程教学大纲课程编号：课程名称：大数据挖掘与分析/ data mining and Data analysis for big data 总学时/学分：40/2.5（其中理论32学时，实验8学时）适用专业：计算机科学与技术一、课程目标通过本课程学习，学生应达到如下目标：目标1：对应用场景，选择适合数据挖掘与分析数学模型。目标2：对数学模型运用Python编程实现，分析结果，综合得到结论，形成报告。二、教学过程安排序号知识模块教学内容课时课程目标教学方法 1 数据分析与挖掘概述 1.1 什么是数据分析和挖掘 1.2 数据分析与挖掘的应用领域 1.3 数据分析与挖掘的区别 1.4 数据挖掘的流程 1.5 常用的数据分析与挖掘工具 2 目标1 课堂讲授 2 从收入的预测分析开始 2.1 下载与安装Anoconda 2.2 基于Python的案例实战 2 目标1 课堂讲授 3 Python数值计算工具——Numpy 4.1 数组的创建与操作 4.2 数组的基本运算符 4.3 常用的数学和统计函数 4.4 线性代数的相关计算 4.5 伪随机数的生成 2 目标1 课堂讲授+演示+测验+作业 4 Python数据处理工具——Pandas 4.1 关系模式的设计与函数依赖 4.2 关系规范化 4.3模式分解 2 目标1 课堂讲授+演示+作业 5 Python数据可视化 6.1 离散型变量的可视化 6.2 数值型变量的可视化 6.3 关系型数据的可视化 6.4 多个图形的合并 2 目标1 课堂讲授+演示+作业 6 线性回归预测模型 7.1 一元线性回归模型 7.2 多元线性回归模型 7.3 回归模型的假设检验 7.4 回归模型的诊断 4 目标1 课堂讲授+演示+作业 7 岭回归与LASSO回归模型 8.1 岭回归模型 8.2 岭回归模型的应用 8.3 LASSO回归模型 8.4 LASSO回归模型的应用 2 目标1 课堂讲授+演示+作业 8 Logistic回归分类模型 9.1 Logistic模型的构建 9.2 分类模型的评估方法 9.3 Logistic回归模型的应用 2 目标1 课堂讲授+演示+作业 9 决策树与随机森林 10.1 节点字段的选择 10.2 决策树的剪枝 10.3 随机森林 10.4 决策树与随机森林的应用 4 目标1 课堂讲授+演示+作业 10 KNN模型的应用 11.1 KNN算法的思想 11.2 最佳k值的选择 11.3 相似度的度量方法 11.4 近邻样本的搜寻方法 11.5 KNN模型的应用 2 目标1 课堂讲授+演示+作业 11 SVM模型的应用 13.1 SVM简介 13.2 几种常见的SVM模型 13.3 分类问题的解决 13.4 预测问题的解决 2 目标1 课堂讲授+演示+作业 12 课内实验实验1.numpy 实验2.pandas 实验3.数据分析和挖掘主要流程实验4. 从电影评分预测理解机器学习基本概念 8 目标2 学生操作教师指导实验报告 13 大作业与讨论以组为单位应用机器学习算法对某一应用场景的数据进行分析、预测 6 目标2 教师指导学生调研写报告、讨论三、实验或上机内容序号实验项目名称实验目的和任务实验学时实验类型开出要求 1 numpy 目的：通过实验，熟练掌握numpy数组创建、拆分、堆叠、基本运算、切片、索引等操作；任务：numpy数组创建、拆分、堆叠、基本运算、切片、索引等操作。 2 设计型必做 2 pandas 目的：熟练掌握pandas的使用。任务：Series、DataFrame的常用操作、读取csv格式数据、排序、删除、算术运算、去重、层次化索引。 2 设计型必做 3 数据分析和挖掘主要流程目的：数学数据分析与挖掘主要流程。任务：使用scikit-learn导入数据集、数据标准化预处理、文本数据特征提取、使用scikit-learn分类器svm对digit数据进行分类；模型持久化，模型评估-量化预测效果。 2 设计型必做 4 从电影评分预测理解机器学习基本概念目的：理解机器学习基本概念。任务：统计数据集基本属性、实现基础预测评分算法、应用模型做预测、评估机器学习模型、基于梯度下降法的模型参数估计。 2 设计型必做（实验类型：从“验证型、综合型、设计型、研究型”中选择一个，开出要求：从“必做、选做”中选择一个，如无“实验或上机内容”则填“无”，删除此表格）四、课程目标达成方法教学目标课时评价方法评价依据达成标准(分) 目标1 26 考试（60%）+