大数据HCIA测试题与参考答案.docxVIP

  • 0
  • 0
  • 约1万字
  • 约 19页
  • 2025-08-11 发布于河南
  • 举报

大数据HCIA测试题与参考答案

一、单选题(共41题,每题1分,共41分)

1.以下哪类数据不属于半结构化数据?

A、二维表

B、HTML

C、JSON

D、XML

正确答案:A

2.Hive是基于hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是?()

A、仅支持MapReduce计算引擎

B、易用易编程

C、可直接访问HDFS文件以及HBase

D、灵活方便的ETL(extract/transform/load)

正确答案:A

3.关于Hive中普通表和外部表的描述不正确的是?

A、默认创建普通表

B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来

C、删除普通表时,元数据和数据同时被删除

D、删除外部表时,只删除外部表数据而不删除元数据

正确答案:D

4.FusionInsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?

A、ZooKeeper

B、HDFS

C、HMaster

D、RegionServer

正确答案:C

5.Flink是流计算处理和批处理平台,()是数据批处理和流处理的核心引擎。()

A、Runtime

B、DataStream

C、DataSet

D、FlinkCore

正确答案:A

6.以下关于Kafka的描述错误的有()

A、用作活动流和运营数据处理管道的基础

B、由ApacheHadoop开发,并于2011年开源

C、具有信息持久化、高吞吐、实时等特性

D、使用Scala、Java语言实现

正确答案:B

7.创建Loader作业时,可以在以下哪个步骤中设置Map数?

A、输入设置

B、基本信息

C、输出

D、转换

正确答案:C

8.kafka集群在运行期间,直接依赖于下面那些组件?()

A、Zookeeper

B、HDFS

C、Spark

D、HBase

正确答案:A

9.关于FusionInsightHDStreaming的Supervisor描述正确的是?

A、Supervisor负责资源分配和任务调度

B、Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的worker进程

C、Supervisor是运行具体处理逻辑的进程

D、Supervisor是一个Topology中接收数据然后执行处理的组件

正确答案:B

10.FusionInsightHD中Loader实例必须与哪个实例部署在一起?

A、DataNode

B、RegionServer

C、ResourceManager

D、NodeManager

正确答案:D

11.以下关于Kafka的描述错误的有?

A、具有消息持久化,高吞吐,实时等特性

B、用作活动流和运营数据处理管道的基础

C、使用Scala,Java语言实现

D、由ApacheHadoop开发,并于2011年开源

正确答案:D

12.下列哪个命令是删除文件的?()

A、dfs-rm

B、dfs-ls

C、dfs-clear

D、dfs-del

正确答案:A

13.关于Hive在FusionInsightHD中的架构描述错误的是?(A)

A、只要有一个Hiveserver不可用,整个Hive集群便不可用

B、HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果

C、MetaStore用于提供元数据服务,依赖于DBService

D、在同一时间点HiveSever只有一个处于Active状态,另一个则处于Standby状态

正确答案:A

14.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?

A、客户端的文件数据经过NameNode传递给DataNode

B、客户端将文件划分为多个Block,根据DataNode的地址信息,按顺序写入每一个DataNode中

C、客户端根据DataNode的地址信息,按顺序将整个文件写入每一个DataNode中,然后由DataNode将文件划分为多个Block

D、客户端只上传数据到一个DataNode,然后由NameNode负责Block复制

正确答案:B

15.为了保障流应用的快照存储的可靠性,快照主要存储在哪里?

A、jobManager的内存中

B、本地文件系统中

C、hdfs中

D、可靠性高的单机数据库中

正确答案:C

16.关于Hive与传统数据仓库的对比,以下描述错误的是?()

A、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错、高可靠。

B、由于Hive基于大数据平台,所以查询效率比传统数据仓库快

C、Hive基于HDFS存储,理论上存储量可以无限扩展,而传统的数据仓库存储量会有上限

D、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传

文档评论(0)

1亿VIP精品文档

相关文档