大数据HCIA模拟考试题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

大数据HCIA模拟考试题

1、HBase中数据存储的文件格式是什么?

HFile

HLog

TextFile

DSequenceFile

答案:A

2、创建loader作业中,可以在以下哪个步骤中设置过滤器类型?()

A、基本信息

B、转换

C、输出

D、输入设置

答案:D

3、FusionlnsightHD中HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?

A、3

B、4

C、5

D、6

答案:c

4、Hadoop平台中HBase的Region是由哪个服务进程来管理?

HMaster

DataNode

RegionServer

ZooKeeper

答案:c

5、为了保证流应用的快照存储的可靠性,快照主要存储在?

A、HDFS中

B、可靠性高的单机数据库中

C、jobManager的内存中

D、本地文件系统中

答案:A

6、下列选项中无法通过大数据技术实现的是?

A、运营分析

B、商业模式发现

D备NameNode应与主NameNode部署到一个节点

答案:AC

49FusionlnsightHD系统中使用Streaming客户端Shell命令查看拓扑或提交拓扑失败,以下哪些定位手段是正确的?

A、查看客户端异常堆栈,判断是否客户端使用问题

B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常

C、查看Supervisor运行日志,判断是否Supervisor异常

D、查看Worker运行日志

答案:AB

50、“Hive中的这条命

令”“SELECTa.salary,b.addressFROMemployeeaJOIN(SELECTaddressFROMemployee_infowhereprovince=,zhejiang,)bONa.name=b.name;“是一个什么类型的操作?”

A、JOIN查询

B、创建表

C、导入数据

D、子查询

答案:AD

51、在华为大数据解决方案中,hadoop底层包含以下那些组件?

miner

hive

spark

fink

答案:BCD

52、Flink可以基于以下哪些窗口进行统计?

A、时间窗口

B、滑动窗口

C、会话窗口

countWindow

答案:ABCD

53、下列关于Flink中TransFormation的说法正确的是?

A、filter操作是对每个元素执行boolean函数

B、keyBy是将源头数据按照key进行分组,以保证同一个key的源数据分到同样的组中

C、可以通过windows设定时间窗口

D、flatMap可以对文本进行切分

答案:ABCD

54、Zookeeper可以为FusionlnsightHD中哪些组件提供分布式管理支持()

HBase

Loader

CHive

DSpark

答案:ABCD

55、关于Flume,下列说话错误的是?()多选

A、Source到Channel到Sink等进程内部有加密的必要

B、Flume级联节点之间的数据传输支持加密

C、Flume支持多级级联和多路复制

D、Flume级联节点之间的数据传输不支持压缩

答案:AD

56、Flink支持的时间操作类型包括以下哪些选项?

A、结束时间

B、处理时间

C、采集时间

D、事件时间

答案:BD

57、Spark有哪些特点?

A、快

B、轻

C、巧

D、灵

答案:ABCD

58、根据数据流如何在两个Transformation之间传输数据,数据流可以分为哪些类型?

A、一对一流

distributing流

C、一对多流

D、redistributing流

答案:AC

59、以下关于Ka珠aLogs中segmentfile的说法正确的有?

A、通过索引信息可以快速定位message

B、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储

C、使index元数据全部映射到memory,可以避免segmentfile的index数据10磁盘操作

D、索引文件稀疏存储,可以大幅度降低index文件元数据占用空间大小

答案:ABCD

60、Zookeeper中的数据节点znode分为哪几种类型?

temporary

persistent

ephemeral

Dsemi-persistent

答案:BC

61FusionlnsightHD集群中包含多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?

HDFS

NameNode

DataNode

HBase

答案:BC

62、MapReduce过程中,以下属于shuffle机制的是?()

combine

copy

partition

sort/merge

答案:BD

63、传统数据处理的性能瓶颈有?

文档评论(0)

贤阅论文信息咨询 + 关注
官方认证
服务提供商

在线教育信息咨询,在线互联网信息咨询,在线期刊论文指导

认证主体成都贤阅网络信息科技有限公司
IP属地四川
统一社会信用代码/组织机构代码
91510104MA68KRKR65

1亿VIP精品文档

相关文档