2026年国开电大大数据技术形考题库100道含答案(完整版).docxVIP

  • 1
  • 0
  • 约2.47万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道含答案(完整版).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、大数据的核心特征“4V”不包括以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Viscosity(粘度)

【答案】:D

解析:本题考察大数据的“4V”核心特征知识点。大数据的“4V”特征包括:Volume(数据容量大)、Velocity(数据产生和处理速度快)、Variety(数据类型多样,如结构化、半结构化、非结构化)、Value(数据价值密度低但通过分析可挖掘高价值)。选项D中的“Viscosity(粘度)”并非大数据特征,属于错误选项。

2、在大数据预处理阶段,用于处理缺失值的方法不包括以下哪项?

A.删除记录(适用于缺失值少的情况)

B.均值填充(用均值替换缺失值)

C.插值法(如线性插值)

D.数据分片(将数据划分成不同块)

【答案】:D

解析:数据预处理中处理缺失值的方法包括删除记录(缺失比例低时)、均值/中位数填充、插值法(如线性/多项式插值)等;数据分片是将数据集按规则划分成多个子数据集(如按行/列或哈希分片),用于并行处理,不属于缺失值处理方法。因此答案为D。

3、以下哪项是Hadoop生态系统中用于高吞吐率日志数据采集的工具?

A.Flume

B.Kafka

C.HDFS

D.MapReduce

文档评论(0)

1亿VIP精品文档

相关文档