- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《数据仓库与数据挖掘》课程教案(首页)
学院: 计算机系/学院
课程/项目名称
数据仓库与数据挖掘
课程
总学时:72学时
理论:54学时
实验:18学时
学分
3
课程
课程类别:专业必修 ■专业必修 □ 公共必修 □公共选修
授课教师
***
授课专业
数据科学与大数据技术
授课班级
教学
目的和要求
本课程的主要目的是培养学生的数据仓库与数据挖掘理论分析与应用实践的综合能力。通过本课程的教学,使学生掌握数据仓库与数据挖掘的一般原理和处理方法,能使用机器学习理论解决数据挖掘相关的问题。
教学
重点、难点
教学重点:
认识数据
数据预处理
数据仓库与联机分析处理
数据仓库设计与开发
回归分析
关联规则挖掘
分类与预测
聚类分析
神经网络与机器学习基础
离群点检测以及Python数据挖掘案例分析等
教学难点:
掌握数据仓库的体系、维度建模和数据仓库设计等;
掌握数据挖掘基本过程、处理步骤和方法;
掌握回归分析、分类、聚类等机器学习算法;
熟练关联规则挖掘方法;
掌握数据分析与数据挖掘的基本方法。
教学
资源
多媒体课件
习题答案
微课视频
其他教学资源:
《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一等主编,清华大学出版社
教学
环境
多媒体教学,课堂教学与学生上机实践相结合
案例实现
《数据仓库与数据挖掘》课程教案
第 1 次课 2 学时
授课内容
数据仓库与数据挖掘概论
教学目的
与要求
通过本课的学习,学生应该掌握如下知识:
数据仓库的定义与特点
数据仓库与操作型数据库的关系
数据仓库的组成、应用
基于Hadoop和Hive的数据仓库技术
数据挖掘的概念与基本内容
数据挖掘的主要任务
数据挖掘的主要数据源
数据挖掘与数据仓库的区别于联系
重点
难点
1)数据仓库与操作型数据库的关系、数据仓库组成
2)数据挖掘的概念、主要任务及数据挖掘主要使用的技术
教学进程
安排
教学导入:
介绍数据仓库与数据挖掘的重要性,举例说明数据仓库和数据挖掘典型案例,逐步引入到课程的介绍内容中来。
授课内容:
一、《数据仓库与数据挖掘(Hadoop+Hive+Python)》课程介绍
介绍本门课程的学科地位、考核方式、学习内容安排、可以参考的学习资料。
讲授数据仓库与数据挖掘的定义、原理与发展
1)数据仓库的定义,与操作型数据库的关系
2)数据仓库的组成与应用
3)讲授数据分析的含义和内容
4)讲授数据挖掘与数据分析的联系与区别
5)讲授数据挖掘的主要任务
6)讲授数据挖掘主要的数据源
课后学习
任务布置
查阅数据挖掘用途的相关资料与案例
主要
参考资料
《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一 等主编,清华大学出版社
《数据仓库与数据挖掘(Hadoop+Hive+Python)》课程教案
第2次课 2 学时
授课内容
认识数据
教学目的
与要求
认识数据。
要求学生应该熟练掌握如下知识的运用:
1)掌握数据的属性及属性类型
2)掌握数据的基本统计描述
3)掌握数据可视化方法
4)掌握数据对象的相似性度量方法
重点
难点
1)数据对象的属性及其分类
2)数据的基本统计描述和数据对象的相似性度量
教学进程
安排
授课内容:认识数据
属性及其类型
属性
数据属性类型
数据的基本统计描述
中心趋势度量
数据散布度量
数据可视化方法
数据对象的相似性度量
不同类型属性的相似性度量方法
距离度量的Python实现
课后学习
任务布置
示例练习,数据对象相似性度量代码实现
主要
参考资料
《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一 等主编,清华大学出版社
《数据仓库与数据挖掘(Hadoop+Hive+Python)》课程教案
第3次课 2 学时
授课内容
数据预处理1
教学目的
与要求
介绍数据预处理的必要性,数据预处理的主要方法。
要求学生应该熟练掌握如下知识的运用:
1)数据预处理方法概述
2)掌握数据清洗的方法
3)掌握利用python进行数据清洗的方法
重点
难点
1)数据清洗内容
2)利用Python进行数据清洗
教学进程
安排
授课内容:
数据预处理的必要性
数据中一般存在的问题
数据质量要求
数据清洗
数据清洗的内容及其方法
利用Pandas进行数据清洗
课后学习
任务布置
Pandas数据结构及其操作、熟悉教材习题
主要
参考资料
《数据仓库与数据挖掘(Hadoop+Hive+Python)》魏伟一 等主编
文档评论(0)