2026年国开电大大数据技术形考题库100道附答案(完整版).docxVIP

  • 1
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道附答案(完整版).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、在大数据技术架构中,负责对海量数据进行分布式处理和计算的是哪个层面?

A.采集层

B.存储层

C.计算层

D.分析层

【答案】:C

解析:本题考察大数据技术架构各层面的功能。大数据技术架构通常分为采集层(数据收集)、存储层(数据持久化)、计算层(分布式处理与计算)、分析层(数据挖掘与价值提取)。计算层的核心职责是对海量数据进行分布式处理和计算,因此正确答案为C。

2、以下哪个是典型的大数据批处理计算框架?

A.MapReduce

B.SparkStreaming

C.ApacheFlink

D.ApacheStorm

【答案】:A

解析:本题考察大数据计算框架类型。MapReduce是Hadoop生态系统中经典的批处理计算框架,适用于离线、大规模数据处理;SparkStreaming、Flink、Storm均以实时流处理为核心设计(可处理批处理但非典型批处理框架)。因此正确答案为A。

3、下列哪个框架不属于实时流处理计算框架?

A.Flink

B.Storm

C.SparkStreaming

D.MapReduce

【答案】:D

解析:本题考察流处理与批处理框架区别,Flink、Storm、SparkStreaming均为实时流处理框架,支持低延迟、高吞吐的实时数据计算;MapReduce是Hadoop生态中的经典批处理框架,适用于离线大规模数据处理(如T+1数据清洗),不具备实时处理能力。因此正确答案为D。

4、大数据的4V特征中,不包含以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:D

解析:本题考察大数据4V特征知识点,大数据经典4V特征为Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值),而Veracity(真实性)属于大数据扩展特征(5V中的第五个V),因此4V特征中不包含D选项,正确答案为D。

5、Spark相比MapReduce,在处理速度上具有显著优势的主要原因是?

A.采用内存计算模式

B.支持更多数据格式

C.使用Java语言开发

D.提供更丰富的API

【答案】:A

解析:本题考察Spark与MapReduce的技术差异。Spark的核心优势在于内存计算(In-MemoryComputing),中间结果存储在内存而非磁盘,避免了MapReduce因多次磁盘IO导致的性能损耗。A选项正确。B选项“支持更多数据格式”是扩展性优势,与速度无关;C选项“使用Java语言开发”不影响处理速度(MapReduce也支持Java);D选项“丰富API”提升开发便利性,但非速度优势的核心原因。因此正确答案为A。

6、以下哪项不属于大数据的典型特征?

A.大量(Volume)

B.高速(Velocity)

C.高安全性

D.多样(Variety)

【答案】:C

解析:本题考察大数据的典型特征知识点。大数据的典型特征通常指5V(或4V,忽略Veracity):A选项“大量(Volume)”是大数据最直观的特征,指数据规模庞大;B选项“高速(Velocity)”指数据产生和处理的速度快;D选项“多样(Variety)”指数据类型包括结构化、半结构化和非结构化数据。而C选项“高安全性”是数据安全领域的要求,不属于大数据的核心特征,因此正确答案为C。

7、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.HDFS(Hadoop分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态系统组件知识点。HDFS是Hadoop的分布式文件系统,专门负责海量数据的分布式存储;MapReduce是批处理计算框架,YARN负责集群资源管理与调度,Hive是数据仓库工具用于数据查询与分析,均不负责核心存储。

8、在大数据处理流程中,以下哪个步骤主要用于处理数据中的缺失值、异常值和重复值?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:A

解析:本题考察大数据预处理步骤知识点。数据清洗的核心任务是处理数据质量问题,包括缺失值填充、异常值修正、重复值删除等;数据集成是合并多源数据,数据转换是调整数据格式,数据规约是降低数据规模。因此正确答案为A。

9、大数据的5V特征不包括以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Validity(有效性)

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档