Hadoop题库(第1-3-8章)_原创精品文档.pdfVIP

  • 8
  • 0
  • 约8.3千字
  • 约 11页
  • 2024-03-18 发布于河南
  • 举报

题库(第一、三、八章)

第一章

单选题

1、大数据的数据量现在已经达到了哪个级别?(C)

A、GB

B、TB

C、PB

D、ZB

2、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?

(A)

A、“TheGoogleFileSystem”

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

3、2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?

(B)

A、“TheGoogleFileSystem”

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

4、2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文

是?(C)

A、“TheGoogleFileSystem”

B、“MapReduce:SimplifiedDataProcessingonLargeClusters”

C、“Bigtable:ADistributedStorageSystemforStructuredData”

D、“TheHadoopFileSystem”

5、对于GFS架构,下面哪个说法是错误的?(A)

A、GFSMaster节点管理所有的文件系统所有数据块。

B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务

器上(可靠性)。块的冗余度默认为3。

C、GFSMaster还管理着系统范围内的活动,比如块服务器之间的数据迁移等

D、GFSMaster与每个块服务器通信(发送心跳包),发送指令,获取状态

6、下面哪个选项不是HDFS架构的组成部分?(D)

A、NameNode

B、DataNode

C、SecondaryNameNode

D、GFS

7、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下

面哪个组件?(D)

A、HDFS

B、MapReduce

C、Yarn

D、HBase

8、与Hadoop1.x相比,Hadoop2.x采用全新的架构,最明显的变化就是增加

了哪个组件?(D)

A、MapReduce

B、Pig

C、HBase

D、Yarn

9、建立在Hadoop文件系统之上的分布式的列式数据库?(A)

A、HBase

B、Hive

C、YARN

D、Mahout

10、下面哪个选项不属于Google的三驾马车?(A)

A、HDFS

B、MapReduce

C、BigTable

D、GFS

多选题

1、下面哪些是大数据的基本特征?(ABCD)

A、数据体量大

B、数据类型多

C、处理速度快

D、价值密度低

2、Hadoop能够使用户轻松开发和运行处理大数据的应用程序,那它主要有下面

哪些特点(ABCD)

A、高可靠性

B、高扩展性

C、高效性

D、高容错性

判断题

(×)1、Google的在大数据解决方案是开源的。

(√)2、GFS分布式文件系统有两个基本组成部分,一个是客户端(Client),

一个是服务端(Server)

(

文档评论(0)

1亿VIP精品文档

相关文档