2026年国开电大大数据技术概论形考题库100道附参考答案【达标题】.docxVIP

  • 1
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道附参考答案【达标题】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在大数据预处理流程中,以下哪项不属于数据清洗的主要内容?

A.处理缺失值(如填充或删除空值)

B.识别并处理异常值(如离群点)

C.去除重复数据(如重复记录)

D.从原始数据源采集数据

【答案】:D

解析:本题考察大数据预处理中数据清洗的范围。数据清洗是对已有数据进行质量优化,主要包括处理缺失值、异常值、重复值等;而“从原始数据源采集数据”属于数据预处理的“数据采集”环节,并非清洗内容。因此正确答案为D,A、B、C均为数据清洗的核心操作。

2、以下哪项不属于大数据的4V特征?

A.Volume

B.Velocity

C.Variety

D.Veracity

【答案】:D

解析:大数据的4V特征通常指Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(数据价值密度低但挖掘后价值高)。Veracity(数据真实性)不属于标准4V特征,属于干扰项,因此正确答案为D。

3、数据预处理中,将不同来源的分散数据合并为统一数据集的步骤是?

A.数据清洗(处理缺失值/异常值)

B.数据集成(合并多源数据)

C.数据转换(标准化/归一化)

D.数据规约(降维/压缩)

【答案】:B

解析:本题考察数据预处理步骤知识点。数据预处理关键步骤包括

文档评论(0)

1亿VIP精品文档

相关文档