Hadoop生态系统概述以及版本演化1.pdf

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LOGO Hadoop生态系统概述以及版本演化 讲师:董西成 议程 1. Hadoop生态系统特点 2. Hadoop介绍 3. Hadoop生态系统 4. Hadoop生态系统版本衍化 5. 总结 小象科技 2 让你的数据产生价值 Hadoop生态系统 特点  源代码开源(免费)  社区活跃、参与者众多  涉及分布式存储和计算的方方面面  已得到企业界验证 小象科技 让你的数据产生价值 Hadoop 1.0与2.0 1. Hadoop生态系统特点 2. Hadoop介绍 3. Hadoop生态系统 4. Hadoop生态系统版本衍化 5. 总结 小象科技 4 让你的数据产生价值 议程 1. Hadoop生态系统特点 2. Hadoop介绍 3. Hadoop生态系统 4. Hadoop生态系统版本衍化 5. 总结 小象科技 5 让你的数据产生价值 Hadoop介绍 概述 分布式存储系统HDFS (Hadoop Distributed File System ) 分布式存储系统 提供了高可靠性、高扩展性和高吞吐率的数据存储服务 资源管理系统YARN (Yet Another Resource Negotiator ) 负责集群资源的统一管理和调度 分布式计算框架MapReduce 分布式计算框架 具有易于编程、高容错性和高扩展性等优点 小象科技 让你的数据产生价值 Hadoop介绍 概述 MapReduce (分布式计算层) YARN (集群资源管理层) HDFS (分布式存储层) 小象科技 让你的数据产生价值 Hadoop构成 HDFS (分布式文件系统)  源自于Google的GFS论文  发表于2003年10月  HDFS是GFS克隆版  HDFS特点  良好的扩展性  高容错性  适合PB级以上海量数据的存储 小象科技 让你的数据产生价值 Hadoop构成 HDFS (分布式文件系统)  基本原理  将文件切分成等大的数据块,存储到多台机器上  将数据切分、容错、负载均衡等功能透明化  可将HDFS看成一个容量巨大、具有高容错性的磁盘  应用场景  海量数据的可靠性存储  数据归档 小象科技 让你的数据产生价值 Hadoop构成 HDFS (分布式文件系统) 小象科技 让你的数据产生价值 Hadoop构成 YARN (资源管理系统)  YARN是什么  Hadoop 2.0新增系统

文档评论(0)

yilinbst + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档