《Hadoop大数据处理实战》习题答案.docVIP

  • 2405
  • 1
  • 约1.41万字
  • 约 15页
  • 2021-06-19 发布于湖北
  • 举报
Hadoop大数据处理实战 Hadoop大数据处理实战 习题答案 习题答案 PAGE 14 PAGE 14 PAGE 13 PAGE 13 PAGE 1 PAGE 1 《Hadoop大数据处理实战》 习题答案 第1章 Hadoop基础知识 1.选择题 (1)A (2)C (3)D (4)B (5)C (6)B (7)A 2.简答题 (1)从狭义上讲,Hadoop是一个适合大数据分布式存储和分布式计算的平台,包括分布式文件系统HDFS、分布式计算系统MapReduce和资源管理系统YARN。 从广义上讲,Hadoop是指以Hadoop为基础的生态圈,是一个很庞大的体系。Hadoop只是其中最重要、最基础的一部分;生态圈中的每个子系统只负责解决某一个特定的问题域(甚至可以更窄)。它并不是一个全能系统,而是多个小而精的系统。 (2)HDFS是针对GFS的开源实现,其冗余存储的方式使得数据的安全性得到了保证。它支持廉价计算机搭建的服务器集群,从而获得了海量数据的分布式存储能力,这使得整个系统具备了高吞吐率、高容错性和高扩展性。 MapReduce是针对Google MapReduce的开源实现,它是一种海量数据集的分布式并行计算编程模型。它可以将大作业拆分成小作业进行作业调度和容错管理,适用于数据的批量处理。MapReduce将复杂的并行计算过程高

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档