大数据HCIA模考试题与参考答案.docxVIP

下载本文档

0
0
约1.09万字
约 36页
2024-11-26 发布于浙江
举报
版权申诉

大数据HCIA模考试题与参考答案.docx

1、本文档共36页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

大数据HCIA模考试题与参考答案

一、单选题（共41题，每题1分，共41分）

1.FusionlnsightHD系统中HDFS的Block默认保存几份？

A、3份

B、2份

C、1份

D、不确定

正确答案：A

2.Hadoop的HBase不适合哪些数据类型的应用场景？

A、大文件应用场景

B、海量数据应用场景

C、高吞吐率应用场景

D、半结构化数据应用场景

正确答案：A

3.安装FusionInsightHD的Streaming组件时，Nimbus角色要求安装几个节点

A、3

B、2

C、4

D、1

正确答案：B

4.以下哪类数据不属于半结构化数据?

A、JSON

B、HTML

C、二维表

D、XML

正确答案：C

5.创建loader作业中，可以在以下哪个步骤中设置过滤器类型？（）

A、转换

B、输入设置

C、输出

D、基本信息

正确答案：B

6.FusionInsightHDHBase默认使用什么作为其底层文件存储系统？

A、HDFS

B、Hadoop

C、Memory

D、MapReduce

正确答案：A

7.下面关于Zookeeper特性的描述错误的是？（）

A、消息更新只能成功或者失败，没有中间状态。

B、Zookeeper节点数必须为奇数个。

C、一条消息要被超过半数的Server接收，它将可以成功写入磁盘

D、客户端所发送的更新会按照它们被发送的顺序进行应用。

正确答案：B

8.查看Kafka某Topic的Partition详细信息时，使用如下哪个命令?

A、bin/kafka-topics.sh--list

B、bin/kafka-topics.sh--create

C、bin/kafka-topics.sh–delete

D、bin/kafka-topics.sh--describe

正确答案：D

9.硬件故障被认为是常态，为了解决这个问题，HDFS设计了副本机制。默认情况下，一份文件，HDFS会存（）份？

A、2

B、4

C、3

D、5

正确答案：C

10.在规划FuskmlnsightHD集群时候，如果客户用于功能测试，对性能没有要求，节约成本的情况下，可以采用管理节点、控制节点、数据节点合一部署，最少需要多少节点？

A、2

B、3

C、4

D、5

正确答案：B

11.KafkaClusterMirroring工具可以实现以下哪些功能？

A、Kafka跨集群数据同步方案

B、Kafka单集群内数据备份

C、Kafka但集群内数据恢复

D、以上全不正确

正确答案：A

12.Flink是流计算处理和批处理平台，（）是数据批处理和流处理的核心引擎。()

A、Runtime

B、DataStream

C、DataSet

D、FlinkCore

正确答案：A

13.HDFS的副本存放策略中，同一机架不同服务器之间的距离是（）

A、2

B、3

C、1

D、4

正确答案：A

14.传统数据处理的数据规模的单位是？

A、TB

B、EB

C、PB

D、GB

正确答案：D

15.在很多小文件场景下，Spark会起很多Task，当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，严重影响性能。FusionInsight中，针对小文件的场景通常采用（）算子，来对Table中的小文件生成的partition进行合并，减少partition数，从而避免在shuffle的时候，生成过多的hash分桶，提升性能？

A、join

B、groupby

C、coalosce

D、connect

正确答案：A

16.FusionInsightHD产品中，关于Kafka的说法不正确的是？

A、Kafka强依赖于Zookeeper

B、Kafka部署的实例个数不得小于2

C、Kafka的服务端可以产生消息

D、Consumer作为Kafka的客户端角色进行消息的消费

正确答案：B

17.Spark应用在运行时，Stage划分的依据是哪个?

A、taskSet

B、action

C、shuffle

D、task

正确答案：C

18.FusionInsightHD部署时，同一集群内的Flumeserver节点建议至少部署几个?

A、1

B、2

C、3

D、4

正确答案：B

19.HBase的底层数据以（）的形式存在的？

A、KeyValue

B、行存储

C、实时存储

D、列存储

正确答案：A

20.关于Hive中普通表和外部表的描述不正确的是？

A、默认创建普通表

B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来

C、删除普通表时，元数据和数据同时被删除

D、删除外部表时，只删除外部表数据而不删除元数据

正确答案：D

21.Hadoop中MapReduce组件擅长处理哪种场景的计算任务？

A、迭代计算

B、流式计算

C、实时交互

您可能关注的文档

文档评论（0）

十四-1 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

大数据HCIA模考试题与参考答案.docxVIP