- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
Coursename:大数据处理与分析
授课语言:中文
A.课程说明
学分:2
上课时间:24学时讲课+16学时实验
学期:第7学期
课程描述:海量数据的处理与分析任务给传统计算机带来了极大的挑战,现有计算机系统结构和数据处理算法难以满足海量数据处理与分析任务在时效、有效性等方面的要求,引起了计算机领域的一次重要变革。本课程首先给出大数据的概述,接着介绍当前主流的开源大数据系统Hadoop的基本概况,再对大数据处理与分析中关键的技术分布式文件系统、大数据处理架构、NoSQL数据库、大数据数据仓库、分布式内存计算、流计算、图计算等进行介绍,最后分解结合互联网、生物医学、物流等行业的应用给出大数据分析的基本框架。使得学生能够选择某一大数据应用场景的要求,确定需要的数据并选择合适的手段进行收集;能对该大数据应用场景进行合理分析和评价,设计和完善相应计算机复杂工程问题的工程实践和解决方案,分析其对于社会、健康、安全、法律、文化的影响,理解应承担的责任;分析和理解大数据处理与分析技术对环境和社会可持续发展可能存在的影响。
B.?教学方法
线上线下混合式教学,课堂讲授,案例讨论
C.?课程目标
目标1:了解大数据技术发展的驱动和局限。
目标2:掌握构建大数据系统的关键技术,能够某一大数据应用场景,合理分析和评价构建大数据系统所面临的复杂工程问题,给出工程实践和解决方案,分析其对于社会、健康、安全、法律、文化的影响。
目标3:针对某一大数据应用场景,确定需要的数据并选择合适的手段进行收集,构建大数据原型系统,分析和理解大数据处理与分析技术对环境和社会可持续发展可能存在的影响。
D.?课程主题/单位和日期
第一次课:数据的概述
(一)课程内容
1.传统计算机面临的新问题;
2.大数据系统的特点;
3.大数据系统与物联网和云计算的关系。
(二)教学要求
1.了解传统计算机的局限;
2.了解大数据系统的特点;
3.理解大数据系统与相关系统之间的关系。
(三)重点与难点
1.重点
大数据系统的特点。
2.难点
大数据系统与相关系统之间的关系。
第二次课:Hadoop的基本概况
(一)课程内容
1.Hadoop简介;
2.Hadoop的基本结构;
3.Hadoop的主要特征。
(二)教学要求
1.掌握Hadoop的基本结构。
2.理解Hadoop的主要特征。
(三)重点与难点
1.重点
Hadoop的基本结构。
Hadoop的主要特征。
2.难点
Hadoop的主要特征。
第三次课:分布式文件系统
(一)课程内容
1.分布式文件系统的概况。
2.HDFS体系结构。
3.HDFS的局限。
(二)教学要求
1.了解分布式文件系统的概况。
2.掌握HDFS体系结构。
3.理解HDFS的局限。
(三)重点与难点
1.重点
HDFS体系结构。
HDFS的局限。
2.难点
HDFS的局限。
第四次课:大数据处理架构
(一)课程内容
1.分布式计算架构的简介。
2.MapReduce的结构。
3.MapReduce的实践。
(二)教学要求
1.了解分布式计算架构。
2.理解MapReduce的结构。
3.掌握MapReduce的实践。
(三)重点与难点
1.重点
MapReduce的结构。
MapReduce的实践。
2.难点
MapReduce的实践。
第五次课:NoSQL数据库
(一)课程内容
1.关系数据库存在的问题。
2.NoSQL数据库简介。
3.NoSQL数据库的发展。
(二)教学要求
1.理解关系数据库存在的问题。
2.掌握NoSQL数据库的基本结构。
3.了解NoSQL数据库的发展。
(三)重点与难点
1.重点
关系数据库存在的问题。
NoSQL数据库的基本结构。
2.难点
NoSQL数据库的基本结构。
第六次课:大数据数据仓库
(一)课程内容
1.大数据数据仓库简介。
2.Hive的基本结构。
(二)教学要求
1.了解大数据数据仓库。
2.掌握Hive的基本结构。
(三)重点与难点
1.重点
Hive的基本结构。
2.难点
Hive的基本结构。
第七次课:分布式内存计算
(一)课程内容
1.Spark的基本结构。
2.Spark与Hadoop的对比。
(二)教学要求
1.掌握Spark的基本结构。
2.了解Spark与Hadoop的差异。
(三)重点与难点
1.重点
Spark的基本结构。
2.难点
Spark与Hadoop的差异。
第八次课:流计算
(一)课程内容
1.流计算概述。
2.Storm
您可能关注的文档
- 2024年度中国汽车工程学会科学技术奖.docx
- 2024年广东省肇庆监狱警察职工餐厅日用百货采购项目.doc
- 2024年临江公司绿化养护服务采购项目.doc
- 2024年校级教改申报指南.docx
- 2024年仪器量值溯源(检定校准)服务报价详单.doc
- G344东灵线石湖街道段路面病害.docx
- GB 17354《乘用车前后端保护装置》.docx
- hLife期刊国际出版服务采购项目招标参数.docx
- IC卡识读学生宿舍管理系统设计文献综述.doc
- LF98型风机采购技术协议.docx
- 人教版七年级地理上册同步备课 4.1人口与人种-分层练习-解析版.docx
- 人教A版数学(选择性必修一讲义)第23讲2.5.2圆与圆的位置关系(学生版+解析).docx
- 人教版八年级物理上册举一反三系2.2声音的特性同步练习(原卷版+解析).docx
- 人教版八年级物理上册举一反三系2.1声音的产生与传播同步练习(原卷版+解析).docx
- 人教A版数学(选择性必修一讲义)第29讲3.2.2双曲线的简单几何性质(学生版+解析).docx
- 人教版八年级物理上册举一反三系3.1温度同步练习(原卷版+解析).docx
- 人教版七年级地理上册同步备课 3.3 降水的变化与分布【上好课】2022-2023学年七年级地理上册同步备课系列(人教版)(分层练习-解析版).docx
- 人教版七年级地理上册同步备课 3.2.1气温的变化与分布(分层练习-原卷版).docx
- 人教版八年级地理上册同步备课1.2人口分层练习(原卷版+解析).docx
- 人教A版数学(选择性必修一讲义)第30讲3.3.1抛物线及其标准方程(学生版+解析).docx
文档评论(0)