2026年大数据分析专家技能评估题库及答案解析.docxVIP

  • 2
  • 0
  • 约8.05千字
  • 约 17页
  • 2026-03-30 发布于四川
  • 举报

2026年大数据分析专家技能评估题库及答案解析.docx

2026年大数据分析专家技能评估题库及答案解析

一、单项选择题(每题2分,共20题,总分40分)

1.以下关于数据仓库(DataWarehouse)与数据湖(DataLake)的描述中,错误的是()。

A.数据仓库存储结构化数据,数据湖可存储结构化、半结构化、非结构化数据

B.数据仓库通常在存储前完成清洗(ETL),数据湖多采用存储后处理(ELT)

C.数据仓库的主要用户是业务分析人员,数据湖的主要用户是数据科学家

D.数据仓库的查询性能通常低于数据湖

答案:D

解析:数据仓库通过预建模(如星型模型)和索引优化,查询性能通常高于数据湖(数据湖因存储原始数据,需实时处理,查询延迟较高)。

2.Hadoop生态中,负责资源管理与任务调度的核心组件是()。

A.HDFS

B.YARN

C.MapReduce

D.Hive

答案:B

解析:YARN(YetAnotherResourceNegotiator)是Hadoop的资源管理系统,负责集群资源分配和任务调度;HDFS是分布式文件系统,MapReduce是计算框架,Hive是数据仓库工具。

3.以下关于SparkRDD(弹性分布式数据集)的特性描述中,错误的是()。

A.不可变(Immutable)

B.可分区(Partit

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档