2026年大数据管理协管员笔试试题及答案解析.docxVIP

  • 0
  • 0
  • 约8.05千字
  • 约 18页
  • 2026-04-24 发布于四川
  • 举报

2026年大数据管理协管员笔试试题及答案解析.docx

2026年大数据管理协管员笔试试题及答案解析

一、单项选择题(每题2分,共20分)

1.在大数据生命周期管理中,数据清洗的主要目的是什么?

A.增加数据存储量

B.提高数据计算速度

C.确保数据质量,消除错误、不一致和冗余

D.将数据转换为图形格式

2.下列哪项不属于大数据“4V”特征?

A.Volume(大量)

B.Velocity(高速)

C.Variety(多样)

D.Verification(验证)

3.Hadoop生态系统中,负责资源管理和作业调度的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.HBase

4.关于数据仓库与数据湖的区别,以下描述正确的是?

A.数据仓库存储原始未处理数据,数据湖存储清洗后的结构化数据。

B.数据仓库模式在写入时定义(Schema-on-Write),数据湖模式通常在读取时定义(Schema-on-Read)。

C.数据仓库通常更适用于存储非结构化和半结构化数据。

D.数据湖的处理延迟通常低于数据仓库。

5.在进行大数据项目时,数据隐私保护至关重要。下列哪种技术主要用于实现数据的匿名化,防止个人身份被识别?

A.数据加密

B.数据脱敏

C.数据备份

D.数据索引

6.以下关于NoSQL数据库的描述,错误的是?

A.具有良好的横向扩展性。

B.严格遵循ACID事务原则。

C.

文档评论(0)

1亿VIP精品文档

相关文档