2026年大数据工程师职业资格考试题库(附答案和详细解析)(0608).docxVIP

  • 0
  • 0
  • 约7.57千字
  • 约 8页
  • 2026-07-05 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0608).docx

大数据工程师职业资格

一、单项选择题(共10题,每题1分,共10分)

在Hadoop生态系统中,负责分布式文件存储的组件是()。A.HBaseB.HDFSC.MapReduceD.ZooKeeper答案:B解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心子项目,设计用于在普通硬件上运行的大型集群上存储海量数据。HBase是基于HDFS的分布式列式数据库,MapReduce是分布式计算框架,ZooKeeper是分布式协调服务。

以下哪种算法通常被用于大数据处理中的数据压缩以减少I/O开销()。A.GZIPB.SnappyC.MD5D.SHA-256答案:B解析:GZIP压缩率高但解压慢,MD5和SHA-256是哈希算法用于校验而非压缩。Snappy是Google开发的高吞吐低延迟的压缩算法,适合Hadoop环境,在压缩率和速度之间取得了良好平衡。

在SparkSQL中,用于将DataFrame转换为RDD的函数是()。A.toDF()B.rdd()C.map()D.collect()答案:B解析:DataFrame是Spark1.3引入的分布式数据集,基于RDD封装。rdd()方法可以将DataFrame转换回底层的RDD对象。toDF()是将RDD转换为Da

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档