2025年大数据工程师职业资格认证考试题库(附答案和详细解析)(0812).docxVIP

  • 2
  • 0
  • 约4.91千字
  • 约 6页
  • 2025-08-14 发布于江苏
  • 举报

2025年大数据工程师职业资格认证考试题库(附答案和详细解析)(0812).docx

2025年大数据工程师职业资格认证考试题库(附答案和详细解析)(0812)

大数据工程师职业资格认证考试试卷

一、单项选择题(共10题,每题1分,共10分)

下列哪种数据类型不适合使用MapReduce进行高效处理?A.结构化数据B.半结构化数据C.非结构化数据D.关系型数据答案:C解析:MapReduce模型最适合处理大规模结构化和半结构化数据,而非结构化数据(如文本、图像)需要额外预处理步骤,且效率较低。

Hadoop生态系统中,负责分布式文件存储的核心组件是?A.YARNB.HiveC.HDFSD.Spark答案:C解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心组件,用于存储大规模数据集。YARN负责资源管理,Hive是数据仓库工具,Spark是快速计算框架。

以下哪种算法不属于监督学习?A.决策树B.K-means聚类C.线性回归D.逻辑回归答案:B解析:K-means聚类属于无监督学习,其余均为监督学习算法。监督学习需要标注数据,而无监督学习处理未标注数据。

在数据采集阶段,哪种方法不属于ETL范畴?A.数据抽取B.数据转换C.数据加载D.数据清洗答案:D解析:ETL(Extract-Transform-Load)包含抽取、转换、加载三个阶段

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档