《大数据挖掘与分析》课程教学大纲.docxVIP

《大数据挖掘与分析》课程教学大纲.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 PAGE 1 页/共 NUMPAGES \* Arabic 5 页 《大数据挖掘与分析》课程教学大纲 课程编号:课程名称:大数据挖掘与分析/ data mining and Data analysis for big data 总学时/学分:40/2.5(其中理论32学时,实验8学时) 适用专业:计算机科学与技术 一、课程目标 通过本课程学习,学生应达到如下目标: 目标1:对应用场景,选择适合数据挖掘与分析数学模型。 目标2:对数学模型运用Python编程实现,分析结果,综合得到结论,形成报告。 二、教学过程安排 序号 知识模块 教学内容 课时 课程目标 教学方法 1 数据分析与挖掘概述 1.1 什么是数据分析和挖掘 1.2 数据分析与挖掘的应用领域 1.3 数据分析与挖掘的区别 1.4 数据挖掘的流程 1.5 常用的数据分析与挖掘工具 2 目标1 课堂讲授 2 从收入的预测分析开始 2.1 下载与安装Anoconda 2.2 基于Python的案例实战 2 目标1 课堂讲授 3 Python数值计算工具——Numpy 4.1 数组的创建与操作 4.2 数组的基本运算符 4.3 常用的数学和统计函数 4.4 线性代数的相关计算 4.5 伪随机数的生成 2 目标1 课堂讲授+演示+测验+作业 4 Python数据处理工具——Pandas 4.1 关系模式的设计与函数依赖 4.2 关系规范化 4.3模式分解 2 目标1 课堂讲授+演示+作业 5 Python数据可视化 6.1 离散型变量的可视化 6.2 数值型变量的可视化 6.3 关系型数据的可视化 6.4 多个图形的合并 2 目标1 课堂讲授+演示+作业 6 线性回归预测模型 7.1 一元线性回归模型 7.2 多元线性回归模型 7.3 回归模型的假设检验 7.4 回归模型的诊断 4 目标1 课堂讲授+演示+作业 7 岭回归与LASSO回归模型 8.1 岭回归模型 8.2 岭回归模型的应用 8.3 LASSO回归模型 8.4 LASSO回归模型的应用 2 目标1 课堂讲授+演示+作业 8 Logistic回归分类模型 9.1 Logistic模型的构建 9.2 分类模型的评估方法 9.3 Logistic回归模型的应用 2 目标1 课堂讲授+演示+作业 9 决策树与随机森林 10.1 节点字段的选择 10.2 决策树的剪枝 10.3 随机森林 10.4 决策树与随机森林的应用 4 目标1 课堂讲授+演示+作业 10 KNN模型的应用 11.1 KNN算法的思想 11.2 最佳k值的选择 11.3 相似度的度量方法 11.4 近邻样本的搜寻方法 11.5 KNN模型的应用 2 目标1 课堂讲授+演示+作业 11 SVM模型的应用 13.1 SVM简介 13.2 几种常见的SVM模型 13.3 分类问题的解决 13.4 预测问题的解决 2 目标1 课堂讲授+演示+作业 12 课内实验 实验1.numpy 实验2.pandas 实验3.数据分析和挖掘主要流程 实验4. 从电影评分预测理解机器学习基本概念 8 目标2 学生操作 教师指导 实验报告 13 大作业与讨论 以组为单位应用机器学习算法对某一应用场景的数据进行分析、预测 6 目标2 教师指导 学生调研写报告、讨论 三、实验或上机内容 序号 实验项目名称 实验目的和任务 实验学时 实验类型 开出要求 1 numpy 目的:通过实验,熟练掌握numpy数组创建、拆分、堆叠、基本运算、切片、索引等操作; 任务:numpy数组创建、拆分、堆叠、基本运算、切片、索引等操作 。 2 设计型 必做 2 pandas 目的:熟练掌握pandas的使用。 任务:Series、DataFrame的常用操作、读取csv格式数据、排序、删除、算术运算、去重、层次化索引。 2 设计型 必做 3 数据分析和挖掘主要流程 目的:数学数据分析与挖掘主要流程。 任务:使用scikit-learn导入数据集、数据标准化预处理、文本数据特征提取、使用scikit-learn分类器svm对digit数据进行分类;模型持久化,模型评估-量化预测效果。 2 设计型 必做 4 从电影评分预测理解机器学习基本概念 目的:理解机器学习基本概念。 任务:统计数据集基本属性、实现基础预测评分算法、应用模型做预测、评估机器学习模型、基于梯度下降法的模型参数估计。 2 设计型 必做 (实验类型:从“验证型、综合型、设计型、研究型”中选择一个,开出要求:从“必做、选做”中选择一个,如无“实验或上机内容”则填“无”,删除此表格) 四、课程目标达成方法 教学目标 课时 评价方法 评价依据 达成标准(分) 目标1 26 考试(60%)+

文档评论(0)

CUP2008013124 + 关注
实名认证
文档贡献者

北京教育部直属高校教师,具有十余年工作经验,长期从事教学、科研相关工作,熟悉高校教育教学规律,注重成果积累

1亿VIP精品文档

相关文档