分布式计算平台-Hadoop环境下的组网方案v02new.pptxVIP

  • 2
  • 0
  • 约1.08千字
  • 约 43页
  • 2017-05-27 发布于重庆
  • 举报

分布式计算平台-Hadoop环境下的组网方案v02new.pptx

分布式计算平台-Hadoop环境下的组网方案v02new

分布式计算平台—— Hadoop环境下的组网方案 ; ;Hadoop介绍 ;Doug Cutting说:这个名字是我的孩子给一头吃饱了的棕黄色大象取的。我的命名标准是简短、容易发音和拼写,没有太多的含义,并且不会被用于别处。小孩是这方面的高手。Google就是小孩子起的名字。 2002年,Hadoop起源于Apache Nutch,一个开源的网络搜索引擎。后来,开发者认为该引擎的架构可扩展度不够,不能解决数十亿网页的搜索问题。怎么办呢? 2003-04年,Google发表了举世闻名的三大论文: BigTable——一个分布式的结构化数据存储系统 GFS——The Google File System MapReduce——个处理和生成超大数据集的算法模型的相关实现;5;MapReduce和HDFS的工作流;MapReduce介绍 ;MapReduce的逻辑数据流 ;MapReduce运行原理;MapReduce图解;JobTracker和TaskTracker;MapReduce运行流程;Hadoop Distributed File System介绍 ;HDFS——Hadoop分布式文件系统;Namenode和Datanode;HDFS——数据写入剖析;HDFS——副本的布局;HDFS——数据读取剖析;某电商Hadoop集群案例 ;某电商Hadoop集群规模;H

文档评论(0)

1亿VIP精品文档

相关文档