2026年大数据工程师职业资格考试题库(附答案和详细解析)(0512).docxVIP

  • 1
  • 0
  • 约4.51千字
  • 约 5页
  • 2026-05-19 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0512).docx

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0512)

大数据工程师职业资格考试试卷

一、单项选择题(共10题,每题1分,共10分)

下列哪种数据存储格式最适合用于大数据场景?A.CSVB.JSONC.ParquetD.XML答案:C解析:Parquet采用列式存储和编码压缩技术,适合分布式计算和存储效率,而CSV、JSON、XML均为行式存储,不适合海量数据处理。

Hadoop生态系统中,用于分布式文件存储的核心组件是?A.HiveB.YARNC.HDFSD.Spark答案:C解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心文件存储系统,而Hive是数据仓库工具,YARN是资源管理器,Spark是计算框架。

以下哪种算法属于聚类算法?A.决策树B.K-MeansC.神经网络D.支持向量机答案:B解析:K-Means通过距离度量将数据分组,属于聚类算法;决策树是分类算法,神经网络和SVM是监督学习算法。

分布式计算框架Spark中,RDD的主要特性是?A.可持久化B.可恢复性C.分布式存储D.以上都是答案:D解析:RDD(ResilientDistributedDataset)支持持久化、容错和分布式存储,是Spark的核心数据结构。

文档评论(0)

1亿VIP精品文档

相关文档