2026年国开电大大数据技术概论形考题库100道及答案【新】.docxVIP

  • 0
  • 0
  • 约2.48万字
  • 约 39页
  • 2026-03-10 发布于宁夏
  • 举报

2026年国开电大大数据技术概论形考题库100道及答案【新】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下哪种技术是基于内存计算的快速大数据处理框架,适用于批处理和流处理场景?

A.HadoopMapReduce

B.ApacheSpark

C.ApacheStorm

D.ApacheFlink

【答案】:B

解析:本题考察大数据关键技术框架知识点。正确答案为B。解析:ApacheSpark是基于内存计算的分布式计算框架,相比HadoopMapReduce(基于磁盘,速度慢),Spark通过内存存储中间结果,处理速度提升数倍,且支持批处理(如离线分析)和流处理(如SparkStreaming);A选项HadoopMapReduce是早期分布式批处理框架,依赖磁盘I/O,性能较低;C选项Storm和D选项Flink是专注于实时流处理的框架,主要用于低延迟场景(如实时监控告警),而Spark更侧重快速批处理和统一的处理引擎。因此B为正确选项。

2、在大数据处理流程中,用于处理数据缺失值、异常值及重复数据的步骤是?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:A

解析:本题考察大数据处理流程中的数据预处理步骤知识点。数据清洗的核心作用是去除或修正数据中的噪声、缺失值、异常值及重复数据,保障数据质量;数据集成是合并多源数据,数据转换是统一数据格式,数据规约是降低数据规模,均与处理缺失值无关。因此正确答案为A。

3、大数据技术中,通常所说的‘4V’核心特征不包括以下哪一项?

A.数据量(Volume)

B.数据速度(Velocity)

C.数据多样性(Variety)

D.数据真实性(Veracity)

【答案】:D

解析:本题考察大数据‘4V’特征的基本概念。大数据经典‘4V’特征为:数据量(Volume,指数据规模庞大)、数据速度(Velocity,指数据产生和处理的速度快)、数据多样性(Variety,指数据类型多样,如结构化、半结构化、非结构化)、数据价值(Value,指从海量数据中挖掘潜在价值)。选项D的‘数据真实性(Veracity)’是后期扩展的特征,并非‘4V’核心定义,因此正确答案为D。

4、以下哪种技术属于大数据批处理计算框架?

A.MapReduce

B.SparkStreaming

C.Flink

D.KafkaStreams

【答案】:A

解析:本题考察大数据处理框架的分类。MapReduce是Hadoop生态中经典的批处理计算框架,适用于离线数据处理;B选项SparkStreaming是基于Spark的流处理框架,属于实时流处理;C选项Flink是开源流处理框架,支持高吞吐低延迟的流处理;D选项KafkaStreams是基于Kafka的流处理库,因此正确答案为A。

5、Hadoop生态系统中,用于分布式存储海量数据的核心组件是?

A.MapReduce

B.HDFS

C.YARN

D.HBase

【答案】:B

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(B)是Hadoop分布式文件系统,负责海量数据的分布式存储;MapReduce(A)是分布式计算框架;YARN(C)是资源管理器,负责集群资源调度;HBase(D)是分布式NoSQL数据库,用于随机读写海量结构化数据。因此正确答案为B。

6、在Hadoop生态系统中,负责分布式计算任务调度和资源管理的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(计算模型)

C.YARN(YetAnotherResourceNegotiator)

D.Hive(数据仓库工具)

【答案】:C

解析:本题考察Hadoop生态系统核心组件功能。YARN(YetAnotherResourceNegotiator)是Hadoop2.x版本引入的资源管理器,负责集群资源(CPU、内存等)的分配与调度,协调MapReduce等任务的执行。A选项HDFS是分布式存储系统;B选项MapReduce是分布式计算框架,负责并行计算任务;D选项Hive是基于Hadoop的数据仓库工具,用于SQL查询,均不符合题意。

7、大数据的4V特征不包括以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Veracity(真实性)

D.Value(价值)

【答案】:C

解析:本题考察大数据的4V特征知识点。大数据的核心特征通常定义为4V:Volume(数据量巨大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(蕴含高价值)。选项C的Veracity(真实性)不属于4V特征,因此正确答案为C。

8、以下哪种计算模

文档评论(0)

1亿VIP精品文档

相关文档