2026年国开电大大数据技术形考题库100道含答案【精练】.docxVIP

  • 0
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道含答案【精练】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、大数据预处理阶段中,用于处理数据中的缺失值、异常值和重复数据的关键步骤是?

A.数据采集(DataCollection)

B.数据清洗(DataCleaning)

C.数据集成(DataIntegration)

D.数据转换(DataTransformation)

【答案】:B

解析:本题考察大数据预处理流程知识点。数据清洗的核心是处理数据质量问题,包括缺失值填充、异常值处理、重复数据去重等;选项A的数据采集是获取原始数据的过程,不涉及清洗;选项C的数据集成是合并多源数据,需先清洗再集成;选项D的数据转换是对数据格式、结构进行转换(如标准化),与处理缺失/异常值无关。因此,正确答案为B。

2、在大数据处理的预处理阶段,以下哪个操作主要用于处理数据中的缺失值和异常值?

A.数据清洗

B.数据集成

C.数据转换

D.数据可视化

【答案】:A

解析:本题考察数据预处理操作知识点。数据清洗是预处理的关键步骤,主要用于处理数据中的缺失值(如空值)、异常值(如离群点)、重复值等问题,确保数据质量。数据集成是合并多源数据,数据转换是对数据进行标准化、归一化等格式转换,数据可视化是结果展示,不属于预处理操作。

3、HDFS默认情况下,为每个数据块存储的副本数量是?

A.1

B.2

C.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档