大数据工程技术人员初级理论测试及答案 .docxVIP

  • 3
  • 0
  • 约9.05千字
  • 约 24页
  • 2026-05-20 发布于未知
  • 举报

大数据工程技术人员初级理论测试及答案 .docx

大数据工程技术人员初级理论测试及答案

一、单项选择题(每题2分,共40分)

1.以下关于HDFS(Hadoop分布式文件系统)的描述中,错误的是:

A.适合存储大文件(GB级以上)

B.默认块大小为128MB

C.支持低延迟的实时数据访问

D.采用主从架构(NameNode+DataNode)

答案:C

解析:HDFS设计目标是高吞吐量的大数据访问,而非低延迟实时访问,低延迟场景更适合使用HBase或本地文件系统。

2.以下哪项不是MapReduce计算模型的核心阶段?

A.Split(分片)

B.Map(映射)

C.Shuffle(混洗)

D.Reduce(归约)

答案:A

解析:MapReduce的核心阶段是Map、Shuffle、Reduce,Split是输入数据的预处理步骤,属于辅助阶段。

3.某企业需要实时采集用户浏览器行为数据(如点击、滚动事件),最适合的工具是:

A.Flume

B.Sqoop

C.Kafka

D.Oozie

答案:C

解析:Kafka是高吞吐量的分布式消息队列,适合实时数据流的采集和传输;Flume主要用于日志文件的收集,Sqoop用于关系型数据库与Hadoop间的批量数据迁移,Oozie是工作流调度工具。

4.关于数据仓库(Da

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档