“云计算(第三版)”配套之16:第5章Hadoop2.0主流开源云架构(二).pptxVIP

  • 37
  • 0
  • 约3.36千字
  • 约 10页
  • 2018-06-02 发布于四川
  • 举报

“云计算(第三版)”配套之16:第5章Hadoop2.0主流开源云架构(二).pptx

“云计算(第三版)”配套之16:第5章Hadoop2.0主流开源云架构(二)

5.2 Hadoop 2.0简述 5.2.1 Hadoop 2.0由来 5.2.2 Hadoop 2.0相关项目 5.2.3 Hadoop应用 3 5.2 Hadoop 2.0简述 Hadoop 2.0由来 开源组织Apache成立开源搜索引擎项目Nutch Apache实现了Nutch版的NDFS和MapReduce NDFS和MapReduce移出Nutch,形成独立项目,称为Hadoop。 工业界称Hadoop 1.X及其以前的版本(0.23.X除外)为Hadoop 1.0, 称Hadoop 2.X及其以后版本为Hadoop 2.0 2002年 2006年 4 将Hadoop 2.0部署至集群后,通过调用Hadoop 2.0程序库,能够用简单的编程模型来处理分布在不同机器上的大规模数据集。 由于采用客户-服务器模式,Hadoop 2.0很容易从一台机器扩展至成千上万台机器,并且每台机器都能提供本地计算存储和本地计算。 考虑到集群中每台机器都可能会出问题(如硬件失效),Hadoop 2.0本身从设计上就在程序层规避了这些问题。 5.2 Hadoop 2.0简述 Hadoop 2.0由来 Hadoop 2.0 分布式存储 (HDFS) 分布式操作系统 (Yarn) 5 5.2 Hadoop 2.0简述 Hadoop 2.0由来 Hadoop至少应当包含分布式存储和分布式计

文档评论(0)

1亿VIP精品文档

相关文档