1+x大数据模拟练习题与参考答案.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

1+x大数据模拟练习题与参考答案

一、单选题(共93题,每题1分,共93分)

1.下列关于MapReduce说法不正确的是()

A、MapReduce来源于google的学术论文

B、MapReduce是一种计算框架

C、MapReduce隐藏了并行计算的细节,方便使用

D、MapReduce程序只能用java语言编写

正确答案:D

2.多用户的情况下,哪个YARN调度器可以最大化集群的吞吐和利用率?()

A、CapacityScheduler

B、FIFOScheduler

C、FairScheduler

D、以上都不是

正确答案:A

3.在确认客户需求,进行确认需求调研的时候,以下说法正确的是()。

A、按计划有步骤的确定客户需求调研。

B、将客户的想法记录下来,就能解决客户的实际问题。

C、先了解细节需求,再了解宏观需求。

D、确定客户需求调研的过程中,不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求,我们要无条件去满足客户的需求。

正确答案:A

4.关于Hadoop单机模式和伪分布式模式的说法,正确的是()

A、两者都起守护进程,且守护进程运行在一台机器上

B、单机模式不使用HDFS,但加载守护进程

C、两者都不与守护进程交互,避免复杂性

D、后者比前者增加了HDFS输入输出以及可检查内存使用情况

正确答案:D

5.下列描述中,哪项不属于Sqoop的缺点()

A、无法控制任务的并发度

B、格式紧耦合

C、安全机制不够完善

D、connector必须符合JDBC模型

正确答案:A

6.在文件属性中,文件的权限用第列字符表示。

A、3-9

B、1-5

C、1-8

D、2-10

正确答案:D

7.大数据平台实施方案流程中,建议整个项目过程顺序是()。A与客户确认实施方案B确认客户需求C系统测试D编写实施方案E用户培训F执行实施方案G项目验收

A、BDAFCEG

B、ABDFCEG

C、DEABCFG

D、BDAFEGC

正确答案:A

8.下面哪个选项不属于DataNode的职责?()

A、保存数据块

B、启动DataNode线程,向NameNode定期汇报数据块信息

C、管理数据块

D、定期向NameNode发送心跳信息保持联系

正确答案:C

9.下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?()

A、sbin

B、etc

C、bin

D、share

正确答案:A

10.有关使用sqoop抽取数据的原理的描述不正确的是()

A、sqoop抽取数据的时候需要保证执行当前用户有权限执行相应的操作

B、sqoop在抽取数据的时候可以指定map的个数,map的个数决定在hdfs生成的

C、sqoop抽取数据是个多节点并行抽取的过程,因此map的个数设置的越多性越好

D、sqoop任务的切分是根据split字段的(最大值-最小值)/map数

正确答案:C

11.Centos中修改文件或目录的访问权限命令

A、chown

B、passwd

C、chmod

D、clear

正确答案:C

12.下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是()

A、FSDataInputStream扩展了DataInputStream以支持随机读

B、为实现细粒度并行,输入分片(InputSplit.应该越小越好

C、一台机器可能被指派从输入文件的任意位置开始处理一个分片

D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割

正确答案:B

13.Hive适合()环境

A、适合应用在大量不可变数据的批处理作业

B、Hive适合关系型数据环境

C、提供实时查询功能

D、Hive适合用于联机(online)事务处理

正确答案:A

14.关于Hadoop的运行机制过程顺序说法正确的是()

A、任务执行-作业提交--作业初始化--任务的分配--任务进度和状态的更新--任务结束

B、任务分配--作业提交--作业初始化--任务的执行--任务进度和状态的更新--任务结束

C、作业初始化--作业提交--任务分配--任务的执行--任务进度和状态的更新--任务结束

D、作业提交--作业初始化--任务分配--任务的执行--任务进度和状态的更新--任务结束

正确答案:D

15.建立在Hadoop文件系统之上的分布式的列式数据库?()

A、HBase

B、Hive

C、YARN

D、Mahout

正确答案:A

16.Zookeeper服务端默认的对外服务端口是?()

A、2181

B、2888

C、3888

D、8088

正确答案:A

17.下面哪个YARN的描述不正确的是?()

A、YARN指Ye

文档评论(0)

135****8296 + 关注
实名认证
内容提供者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2025年08月06日上传了教师资格证

1亿VIP精品文档

相关文档