- 1、本文档共44页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
走进大数据世界
教学单元名称
大数据概述
教
学
目
标
能力目标
独立查阅相关资料的能力
知识目标
了解大数据产生背景、概念及其影响
了解大数据的关键技术、计算模式
了解大数据与云计算和物联网之间的关系
素质目标
接受新知识、自主学习、查阅资料的能力
教学重点
1、大数据产生背景和概念
2、大数据的关键技术
3、大数据与云计算和物联网之间的关系
教学难点
无
教学方法
提问法、讨论法、讲授法
教学时数
2学时
教学过程设计
教学环节
教学内容
教师活动
学生活动
新课引入
学生自己对大数据的理解
大数据在现实生活中的应用
大数据产生的背景
讲解
听讲记录
任务描述
提出本次学习的任务——了解大数据
讲解
听讲记录
课程要点讲解
1.大数据产生背景、概念及其影响
关键字:第三次信息浪潮、纸牌屋、4V
讲解
搜集资料、交流
2.大数据的关键技术、计算模式
重点介绍数据的采集与预处理、数据存储和管理、数据处理与分析、数据安全和隐私保护??
讲解
对大数据处理的不同阶段分别进行讲解
3.大数据与云计算和物联网之间的关系
重点介绍三者的概念及其关系
?
讲解
听讲记录
详
细
讲
解
1.大数据产生背景、概念及其影响
1)大数据产生的背景:第三次信息化浪潮、信息科技为大数据时代提供技术支撑、数据产生方式的变革促成大数据时代的来临
2)大数据的概念:4V,数据量大(Volume)、数据类型繁多(Variety)、处理速度快(Velocity)、价值密度低(Value)
3)大数据的影响:在思维方式方面,大数据完全颠覆了传统的思维方式:全样而非抽样、效率而非精确、相关而非因果
讲解
分组讨论
大数据的关键技术、计算模式
1)大数据的关键技术:数据的采集与预处理、数据存储和管理、数据处理与分析、数据安全和隐私保护?
2)大数据计算模式:批处理计算(针对大规模数据的批量)、处理流计算(针对流数据的实时计算)、图计算(针对大规模图结构数据的处理)查询分析计算(大规模数据的存储管理和查询分析)
讲解
听讲记录、交流
大数据与云计算和物联网之间的关系
云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系
讲解
分组讨论、交流
教学小结
根据课堂教学情况,之处学生对本堂课中知识点难以理解的地方,结合教学重点和难点,对所学知识进一步强化。
讲解
学生记录
布置作业
1、大数据的4个基本特征;
2、举例说明大数据的具体应用;
3、阐述大数据、云计算和物联网三者之间的关系?
走进Hadoop世界
教学单元名称
Hadoop
教
学
目
标
能力目标
独立查阅相关资料的能力
知识目标
了解Hadoop的发展史、特性和应用现状
掌握Hadoop生态系统的组成
素质目标
接受新知识、自主学习、查阅资料的能力
教学重点
1、Hadoop的发展史、特性
2、Hadoop的生态圈
教学难点
Hadoop生态圈的组成及各自的功能
教学方法
提问法、讨论法、讲授法
教学时数
2学时
教学过程设计
教学环节
教学内容
教师活动
学生活动
新课引入
学生对大数据架构的理解
Hadoop的功能组件
讲解
听讲记录
任务描述
提出本次学习的任务——了解Hadoop
讲解
听讲记录
课程要点讲解
Hadoop概述
关键字:特性、版本
讲解
搜集资料、交流
Hadoop生态系统
重点介绍HDFS、HBase、MapReduce、YARN、Hive、HBase、Pig、Sqoop、Zookeeper、Storm、Flume、Spark
讲解
对不同子项目进行综合讲解
详
细
讲
解
1.Hadoop的发展史、特性和应用现状
1)Hadoop的发展史:Hadoop源自始于2002年的ApacheNutch项目——一个开源的网络搜索引擎并且也是Lucene项目的一部分。
2)Hadoop的特性:高可靠性、高效性、高可扩展性、高容错性、成本低、运行在Linux平台上、支持多种编程语言
3)Hadoop的版本:ApacheHadoop版本分为两代,我们将第一代Hadoop称为Hadoop1.0,第二代Hadoop称为Hadoop2.0
讲解
分组讨论
Hadoop生态系统
Hadoop的项目结构不断丰富发展,已经形成一个丰富的Hadoop生态系统
HDFS:分布式文件系统
MapReduce:分布式并行编程模型
YARN:资源管理和调度器
Tez:运行在YARN之上的下一代Hadoop查询处理框架
Hive:Hadoop上的数据仓库
HBase:adoop上的非关系型的分布式数据库
Pig:一个基于Hadoop的大规模数据分析平台,提供类似SQL的查询语言PigLatin
Sqoop:用于在Hadoop与传统数据库之间进行数据传递
Oozi
文档评论(0)