- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《Hadoop大数据分析基础》教学大纲
课程英文名
Analysis Basis of Big Data on Hadoop
课程代码
J0701Z03
学分
3
总学时
48
理论学时
24
实验/实践学时
24
课程类别
专业课
课程性质
任选
先修课程
Hadoop分布式系统
适用专业
信息与计算科学、数学与应用数学
开课学院
理学院
一、课程地位与课程目标
(一)课程地位
《Hadoop大数据分析基础》是数据科学与技术方向一门重要的专业课程,它是在Hadoop大数据平台基础上,利用Spark系统进行大数据分析,利用Storm系统进行流式分析。本课程在专业培养体系中具有重要的地位,对培养学生进行大数据计算和分析能力的起到重要的作用。
(二)课程目标
1.掌握大数据分析基本原理和方法;
2.熟悉Hadoop生态环境下的Spark系统配置、常用分析工具及其程序设计实现;
3.熟悉Hadoop生态环境下的Storm系统配置、常用分析工具及其程序设计实现;
4.掌握大数据分析程序设计方法。
二、课程目标达成的途径与方法
以课堂教学为主,结合自学、课堂讨论、课外作业、实验验证等。
课堂教学,采用ppt和板书结合讲解,并通过程序演示
课堂讨论,围绕一个关键问题,分组讨论,并选派学生阐述自己的观点
课外作业,在教材每个章节后面的练习中选择有代表性的问题作为学生课后的书面作业,检查学生对知识的掌握程度
实验验证,选择适当的案例,通过仿照例子编写一定的程序代码,验证理论,提高能力
三、课程目标与相关毕业要求的对应关系
课程目标
课程目标对毕业要求的支撑程度(H、M、L)
毕业要求4
毕业要求6
毕业要求10
课程目标1
H
M
M
课程目标2
H
M
M
课程目标3
H
M
M
课程目标4
H
M
M
注:1.支撑强度分别填写H、M或L(其中H表示支撑程度高、M为中等、L为低)。
四、课程主要内容与基本要求
第1章 绪论内容:大数据的概念;大数据分析的过程、技术与难点
要求:了解大数据的概念;了解大数据分析的过程、技术与难点 第2章 大数据分析模型 内容:大数据分析模型建立方法,基本统计量,推断统计;关联分析模型;分类分析模型;聚类分析模型;结构分析模型;文本分析模型
要求:了解大数据分析模型的建立方法;掌握关联分析模型,分类分析模型,聚类分析模型;了解结构分析模型,文本分析模型
大数据分析的数据预处理
内容:数据抽样和过滤;数据标准化与归一化;数据清洗;降维
要求:掌握数据抽样和过滤,数据标准化与归一化,数据清洗;了解降维方法
面向大数据的数据仓库系统内容:数据仓库;分布式数据仓库系统;基于Hadoop的数据仓库系统
要求:了解数据仓库概念;掌握基于Hadoop的数据仓库系统
大数据分析算法内容:回归算法;关联规则挖掘算法;分类算法;聚类算法
要求:掌握回归算法;关联规则挖掘算法;分类算法;聚类算法
大数据计算平台内容:基于Spark的大数据分析
要求:掌握Spark计算平台的基本使用
第7章 流式计算平台内容: 流式计算概述;基于Storm的大数据分析实例 326要求:掌握基于Storm计算平台的基本使用
五、课程学时安排
章节号
教学内容
学时数
学生任务
对应课程目标
第1章
绪论
2
1.完成本章练习
2.预习下一章内容
课程目标1
第2章
大数据分析模型
12
1.完成本章练习
2.预习下一章内容
课程目标1
第3章
大数据分析的数据预处理
4
1.完成本章练习
2.预习下一章内容
课程目标1
第4章
面向大数据的数据仓库系统
4
1.完成本章练习
2.预习下一章内容
课程目标1
第5章
大数据分析算法
8
1.完成本章编程练习
2.预习下一章内容
课程目标1
课程目标4
第6章
大数据计算平台
10
1.完成本章编程练习
2.预习下一章内容
课程目标1
课程目标2
课程目标3
课程目标4
第7章
流式计算平台
8
1.完成本章编程练习
2.预习下一章内容
课程目标1
课程目标2
课程目标3
课程目标4
六、实践环节及基本要求
序号
实验项目名称
学时
基本要求
学生任务
实验性质
实验类别
1
大数据分析模型
6
验证模型
完成编程验证
验证
必做
2
数据预处理
2
验证预处理方法
完成编程验证
验证
必做
3
数据仓库
2
验证数据仓库管理
完成编程验证
验证
必做
4
大数据分析算法
4
验证分析算法实例
完成编程验证
验证
必做
5
大数据计算平台
6
验证计算实例
完成编程验证
验证
必做
6
流式计算平台
4
验证流式计算实例
完成编程验证
验证
必做
注:1.实验性质指演示性、验证性、设计性、综合性等;2.实验类别指必做、选做等。
七、考核方式及成绩评定
考核内容
考核方式
评定标准(依据
您可能关注的文档
最近下载
- (2024秋新版)人教PEP版三年级英语上册全册教案.doc
- ISO15189质量手册--输血科通用模版(文档-100页).docx VIP
- RBA6.0版标准资料学习课件.ppt VIP
- 2025年北森领导力测试题及答案.doc VIP
- AI政务大厅业务平台架构方案.pptx VIP
- 医疗器械临床应用管理办法.pptx VIP
- 征信简版电子版PDF个人信用报告最新版2024年可编辑带水印模板.pdf VIP
- 人工智能对人类发展利大于弊VS弊大于利辩论赛正方辩词一辩、二辩、三辩、四辩发言稿.pptx VIP
- 人工智能对人类发展利大于弊VS弊大于利辩论赛 反方辩词一辩、二辩、三辩、四辩发言稿.docx VIP
- 北森在线测评题库及答案.doc VIP
文档评论(0)