- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《数据挖掘与机器学习》课程教学大纲
一、课程信息
课程名称
数据挖掘与机器学习
英文名称
DataMiningandMachineLearning
课程编码
316042412
课程类别
专业核心课程
是否为混合式课程
否
课程性质
必修
学分
3.5
学时
总学时:72
理论
学时
36
实践/实
验学时
36
线上拓展
学时
适用专业
数据科学与大数据技术
建议修读学期
第5学期
先修课程
数据库系统与应用,Python数据分析与可视化、优化理论与方法
考核方式
考试(√)考查()
成绩构成及比例:过程性评价(平时作业、期中考试、课内实验)50%
结果性评价(期末考试)50%
大纲执笔人
大纲审核人
注:线上拓展学时为教师安排学生利用课余时间完成线上学习的学时。
二、课程简介
数据挖掘与机器学习是数据科学与大数据技术专业的一门核心基础课,也是进行数据分析和处理必不可少的基础。通过本课程的学习,使学生掌握数据预处理技术(包括数据度量、数据清理、数据集成和转换等方法)和数据挖掘与机器学习技术(包括分类、预测、关联和聚类的概念与技术),并且熟悉数据挖掘与机器学习基本原理和发展方向,提升解决复杂数据工程问题能力,激发学生科技报国的家国情怀和使命担当,锻炼创造性思维和创新性实践能力,具备初步的科研能力和创造能力。
数据挖掘与机器学习作为理论和实践结合的课程,其先修课是概率论与数理统计、Python数据分析与可视化、优化理论与应用,这三门课程为本课程提供理论基础与实践工具。本课程也是行业大数据分析、大数据处理综合实践、数据挖掘课程设计等专业课的重要基础。
三、课程内容及要求
(一)引言(2学时)
1.教学内容
理论教学(2学时):
(1)掌握数据挖掘与机器学习的概念、内容。
(2)数据挖掘的任务、数据源、存在的问题与常用工具。
(3)数据挖掘与机器学习课程的核心地位和学习目标(思政教育内容:我国大数据政务平台、大数据医疗平台等优秀的公司案例,展示中国目前蓬勃开展的数据挖掘技术,培养学生的爱国情怀,同时帮助学生树立专业自信心)。
2.基本要求
(1)数据分析与数据挖掘的基本内容及其联系和区别,数据挖掘与机器学习的基本内容及其联系和区别。
(2)要求学生掌握数据挖掘和机器学习中存在的主要问题,数据建模的常用工具以及Python数据挖掘与机器学习的常用库。
3.重点及难点
重点:数据挖掘与机器学习的基本流程。
难点:数据挖掘与机器学习的主要问题。
4.教学模式:课堂讲述与讨论
5.作业及课外学习要求
(1)要求学生完成数据挖掘与机器学习基本概念的知识性作业;
(2)要求学生阅读文献或查阅资料,完成数据挖掘与机器学习发展的综述性书面作业;
(二)认识数据(4学时)
1.教学内容:
理论教学(2学时)
(1)数据对象的属性及其类型。
(2)数据的基本统计描述。
(3)数据可视化。
(4)数据对象的相似性度量。(思政融入点:特征选择时,通过算法选择出对识别有重大贡献的特征,坚决淘汰不良文化(贡献小)的影响。)
实验教学(2学时)
(1)数据对象及其相似性度量的Python实现。
(2)数据对象的统计描述及Python和Scipy实现。
2.基本要求:
(1)掌握数据对象及其属性和类型;
(2)掌握数据对象的相似性度量;
(3)掌握并能实验数据中心趋势和散度的度量方法,数据直方图、散点图等数据可视化方法,数据相似性和相异性的度量方法。
3.重点及难点:
重点:数据对象的属性类型、相似性度量。
难点:具有混合数据类型属性的数据对象相似性度量。
4.教学模式:课堂讲述与讨论,上机实验
5.作业及课外学习要求
(1)要求学生完成数据对象相关基本概念的知识性作业;
(2)要求学生完成数据对象相似性度量的习题;
(3)要求学生编程环境中完成数据对象的相似性度量和数据的统计描述;
(三)数据预处理(6学时)
1.教学内容:
理论教学(4学时)
(1)数据预处理的必要性。
(2)数据清洗。
(3)数据异常值检测。
(4)数据集成。
(5)数据标准化。
(6)数据规约(思政融入点:“横看成岭侧成峰,远近高低各不同”,从不同维度探索高维数据,看清事物全貌。)。
实验教学(2学时)
(1)利用Pandas进行数据清洗。
(2)利用sklearn进行数据预处理。
2.基本要求:
(1)掌握数据预处理的基本过程;
(2)掌握数据预处理的算法和方法;
(3)掌握并能实验处理数据相关性的方法、数据规范化方法以及主成分分析方法。
3.重点及难点:
重点:数据预处理的内容及其典型算法和方法。
难点:数据规约中的属性选择、维度规约、数据压缩以及傅里叶变换、小波变换和PCA主成分分析。
4.教学模式:课堂讲述与讨论,上机实验
5
您可能关注的文档
最近下载
- 第20课 五四运动与中国共产党的诞生必修中外历史纲要上 (2).pptx VIP
- 久谦-中信产业基金第三方物流及快递投资目标筛选项目 v3.6-20120118.pptx VIP
- 《景观生态学》全套教学课件.ppt
- 幼儿园公开招聘教职员工简章.pdf
- 2023年财务分析题库完整版.doc
- CJJ∕T 135-2009 (2023年版) 透水水泥混凝土路面技术规程.pdf
- 第二章第五节 跨学科实践:制作隔音房间模型-人教版2024物理八年级上学期.pptx
- [股市论谈]53万打天下(53万实盘帐户天天更新).t
- 第9课 创新增才干-【中职专用】2024年中职思想政治《哲学与人生》金牌课件(高教版2023·基础模块).pptx VIP
- 纲要(上)第20课 五四运动与中国共产党的诞生课件(共23张PPT).pptx VIP
文档评论(0)