2026年国开电大大数据技术概论形考题库100道及答案【各地真题】.docxVIP

  • 0
  • 0
  • 约2.53万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及答案【各地真题】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据的“4V”特征中,指数据产生和处理的速度快的是哪个特征?

A.Volume(数据规模)

B.Velocity(数据速度)

C.Variety(数据多样性)

D.Value(数据价值密度)

【答案】:B

解析:本题考察大数据的核心特征知识点。大数据“4V”特征中,Velocity(速度)特指数据产生和处理的速度快,如实时数据流的处理需求;A选项Volume是指数据规模巨大;C选项Variety是指数据类型多样(结构化、半结构化、非结构化);D选项Value是指数据价值密度低(海量数据中有效信息占比小)。因此正确答案为B。

2、在大数据预处理阶段,以下哪项不属于数据清洗的主要操作?

A.处理缺失值(如填充或删除)

B.数据标准化(如Min-Max归一化)

C.去除重复数据(如去重操作)

D.数据降维(如主成分分析PCA)

【答案】:D

解析:本题考察数据预处理的核心环节。数据清洗主要处理数据质量问题:A(处理缺失值)、C(去除重复数据)是典型清洗操作;B(数据标准化)属于数据变换(归一化),是预处理重要步骤;D(数据降维)属于特征工程,目的是减少维度、提升效率,不属于数据清洗(清洗侧重处理错误/异常数据,降维侧重优化特征)。因此答案为D。

3、Hadoop生态系统中,负责分布

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档