2026年大数据工程师职业资格考试题库(附答案和详细解析)(0605).docxVIP

  • 2
  • 0
  • 约7.55千字
  • 约 9页
  • 2026-07-05 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0605).docx

大数据工程师职业资格

一、单项选择题(共10题,每题1分,共10分)

在Hadoop生态系统中,负责分布式文件存储的组件是:A.HadoopMapReduceB.HadoopHDFSC.HadoopHiveD.HadoopZookeeper

答案:B解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心子项目,专门用于存储海量数据;MapReduce是用于处理数据的计算框架;Hive是基于HDFS的数据仓库工具;Zookeeper是分布式协调服务。

下列哪个协议通常用于大数据环境下的数据传输,支持断点续传?A.FTPB.HTTPC.SSHD.SFTP

答案:A解析:FTP(文件传输协议)支持断点续传功能,适合大文件传输;HTTP/HTTPS主要用于Web资源传输;SSH主要用于远程登录;SFTP是FTP的安全版本,虽然也支持断点续传,但在传统大文件传输场景中FTP更为通用。

在Spark中,用于处理基于键值对数据的分布式内存计算抽象是:A.RDDB.DataFrameC.DatasetD.GraphX

答案:A解析:RDD(弹性分布式数据集)是Spark的核心抽象,代表一个不可变、可分区、里面的元素可并行计算的集合;DataFrame和Dataset是较新的API,基于RDD构

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档