- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LOGO
Hadoop生态系统概述以及版本演化
讲师:董西成
议程
1. Hadoop生态系统特点
2. Hadoop介绍
3. Hadoop生态系统
4. Hadoop生态系统版本衍化
5. 总结
小象科技 2
让你的数据产生价值
Hadoop生态系统 特点
源代码开源(免费)
社区活跃、参与者众多
涉及分布式存储和计算的方方面面
已得到企业界验证
小象科技
让你的数据产生价值
Hadoop 1.0与2.0
1. Hadoop生态系统特点
2. Hadoop介绍
3. Hadoop生态系统
4. Hadoop生态系统版本衍化
5. 总结
小象科技 4
让你的数据产生价值
议程
1. Hadoop生态系统特点
2. Hadoop介绍
3. Hadoop生态系统
4. Hadoop生态系统版本衍化
5. 总结
小象科技 5
让你的数据产生价值
Hadoop介绍 概述
分布式存储系统HDFS (Hadoop Distributed File System )
分布式存储系统
提供了高可靠性、高扩展性和高吞吐率的数据存储服务
资源管理系统YARN (Yet Another Resource Negotiator )
负责集群资源的统一管理和调度
分布式计算框架MapReduce
分布式计算框架
具有易于编程、高容错性和高扩展性等优点
小象科技
让你的数据产生价值
Hadoop介绍 概述
MapReduce (分布式计算层)
YARN (集群资源管理层)
HDFS (分布式存储层)
小象科技
让你的数据产生价值
Hadoop构成 HDFS (分布式文件系统)
源自于Google的GFS论文
发表于2003年10月
HDFS是GFS克隆版
HDFS特点
良好的扩展性
高容错性
适合PB级以上海量数据的存储
小象科技
让你的数据产生价值
Hadoop构成 HDFS (分布式文件系统)
基本原理
将文件切分成等大的数据块,存储到多台机器上
将数据切分、容错、负载均衡等功能透明化
可将HDFS看成一个容量巨大、具有高容错性的磁盘
应用场景
海量数据的可靠性存储
数据归档
小象科技
让你的数据产生价值
Hadoop构成 HDFS (分布式文件系统)
小象科技
让你的数据产生价值
Hadoop构成 YARN (资源管理系统)
YARN是什么
Hadoop 2.0新增系统
文档评论(0)