大数据HCIA测试题与参考答案.docxVIP

下载本文档

0
0
约1万字
约 19页
2025-08-11 发布于河南
举报

大数据HCIA测试题与参考答案.docx

大数据HCIA测试题与参考答案

一、单选题（共41题，每题1分，共41分）

1.以下哪类数据不属于半结构化数据？

A、二维表

B、HTML

C、JSON

D、XML

正确答案：A

2.Hive是基于hadoop的数据仓库软件，可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是？（）

A、仅支持MapReduce计算引擎

B、易用易编程

C、可直接访问HDFS文件以及HBase

D、灵活方便的ETL（extract/transform/load）

正确答案：A

3.关于Hive中普通表和外部表的描述不正确的是？

A、默认创建普通表

B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来

C、删除普通表时，元数据和数据同时被删除

D、删除外部表时，只删除外部表数据而不删除元数据

正确答案：D

4.FusionInsightHD系统中，以下选项哪一个不是HBase写数据流程涉及的角色或服务?

A、ZooKeeper

B、HDFS

C、HMaster

D、RegionServer

正确答案：C

5.Flink是流计算处理和批处理平台，（）是数据批处理和流处理的核心引擎。()

A、Runtime

B、DataStream

C、DataSet

D、FlinkCore

正确答案：A

6.以下关于Kafka的描述错误的有（）

A、用作活动流和运营数据处理管道的基础

B、由ApacheHadoop开发，并于2011年开源

C、具有信息持久化、高吞吐、实时等特性

D、使用Scala、Java语言实现

正确答案：B

7.创建Loader作业时，可以在以下哪个步骤中设置Map数？

A、输入设置

B、基本信息

C、输出

D、转换

正确答案：C

8.kafka集群在运行期间，直接依赖于下面那些组件？（）

A、Zookeeper

B、HDFS

C、Spark

D、HBase

正确答案：A

9.关于FusionInsightHDStreaming的Supervisor描述正确的是?

A、Supervisor负责资源分配和任务调度

B、Supervisor负责接受Nimbus分配的任务，启动和停止属于自己管理的worker进程

C、Supervisor是运行具体处理逻辑的进程

D、Supervisor是一个Topology中接收数据然后执行处理的组件

正确答案：B

10.FusionInsightHD中Loader实例必须与哪个实例部署在一起?

A、DataNode

B、RegionServer

C、ResourceManager

D、NodeManager

正确答案：D

11.以下关于Kafka的描述错误的有？

A、具有消息持久化，高吞吐，实时等特性

B、用作活动流和运营数据处理管道的基础

C、使用Scala，Java语言实现

D、由ApacheHadoop开发，并于2011年开源

正确答案：D

12.下列哪个命令是删除文件的？（）

A、dfs-rm

B、dfs-ls

C、dfs-clear

D、dfs-del

正确答案：A

13.关于Hive在FusionInsightHD中的架构描述错误的是?(A)

A、只要有一个Hiveserver不可用，整个Hive集群便不可用

B、HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果

C、MetaStore用于提供元数据服务，依赖于DBService

D、在同一时间点HiveSever只有一个处于Active状态，另一个则处于Standby状态

正确答案：A

14.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?

A、客户端的文件数据经过NameNode传递给DataNode

B、客户端将文件划分为多个Block，根据DataNode的地址信息，按顺序写入每一个DataNode中

C、客户端根据DataNode的地址信息，按顺序将整个文件写入每一个DataNode中，然后由DataNode将文件划分为多个Block

D、客户端只上传数据到一个DataNode，然后由NameNode负责Block复制

正确答案：B

15.为了保障流应用的快照存储的可靠性，快照主要存储在哪里？

A、jobManager的内存中

B、本地文件系统中

C、hdfs中

D、可靠性高的单机数据库中

正确答案：C

16.关于Hive与传统数据仓库的对比，以下描述错误的是？()

A、由于Hive的数据存储在HDFS中，所以可以保证数据的高容错、高可靠。

B、由于Hive基于大数据平台，所以查询效率比传统数据仓库快

C、Hive基于HDFS存储，理论上存储量可以无限扩展，而传统的数据仓库存储量会有上限

D、Hive元数据存储独立于数据存储之外，从而解耦合元数据和数据，灵活性高，而传

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

大数据HCIA测试题与参考答案.docxVIP