2026年国开电大大数据技术概论形考题库100道含答案【黄金题型】.docxVIP

  • 1
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道含答案【黄金题型】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在Hadoop生态系统中,负责实现分布式数据存储的核心组件是?

A.MapReduce(分布式计算框架)

B.HDFS(分布式文件系统)

C.YARN(资源管理器)

D.Spark(内存计算引擎)

【答案】:B

解析:本题考察Hadoop生态系统的核心组件功能。A选项MapReduce是Hadoop早期的分布式计算框架,专注于并行处理海量数据;B选项HDFS(HadoopDistributedFileSystem)是Hadoop生态中负责分布式存储的核心组件,将数据分散存储在多台服务器上;C选项YARN(YetAnotherResourceNegotiator)主要负责集群资源管理和任务调度;D选项Spark是独立的内存计算引擎,虽可与Hadoop集成,但不属于Hadoop原生的分布式存储组件。因此正确答案为B。

2、Hadoop分布式文件系统(HDFS)的核心作用是?

A.存储海量结构化与非结构化数据

B.实现大规模数据的并行计算

C.对数据进行清洗和转换

D.对数据进行实时可视化展示

【答案】:A

解析:本题考察HDFS功能知识点。HDFS是Hadoop生态系统的核心存储组件,其设计目标是高容错、高吞吐量,适用于存储PB级以上的海量数据(含文本、日志、图片等结构化/非结构化数据)。B选项并行计算是MapReduce的核心功能;C选项数据清洗属于数据预处理阶段;D选项数据可视化属于数据分析后的结果呈现环节,均非HDFS的核心作用。

3、大数据的4V特征中,“Volume”指的是数据的什么特性?

A.数据量巨大

B.数据处理速度快

C.数据类型多样

D.数据价值密度高

【答案】:A

解析:本题考察大数据的基本特征知识点。大数据的4V特征包括:Volume(容量/数据量巨大)、Velocity(速度/处理速度快)、Variety(多样性/数据类型多样)、Value(价值/低价值密度但蕴含潜在价值)。选项B对应Velocity,选项C对应Variety,选项D描述错误(大数据通常低价值密度),因此正确答案为A。

4、以下哪个是Hadoop分布式文件系统的英文缩写?

A.HDFS

B.HBase

C.Hive

D.Hadoop

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。HDFS是HadoopDistributedFileSystem的缩写,是Hadoop分布式文件系统,用于存储海量数据;HBase是HadoopDatabase(分布式NoSQL数据库),Hive是基于Hadoop的数据仓库工具,Hadoop是整体框架名称而非文件系统缩写。因此正确答案为A。

5、以下哪项是大数据批处理的典型技术框架?

A.SparkStreaming(流处理框架)

B.Flink(流处理框架)

C.HadoopMapReduce(分布式计算框架)

D.Storm(实时流处理框架)

【答案】:C

解析:本题考察大数据处理技术框架的分类。HadoopMapReduce是经典的大数据批处理分布式计算框架,适用于离线数据处理;而SparkStreaming、Flink、Storm均属于流处理框架,主要用于实时或近实时数据处理。因此正确答案为C。

6、下列哪种计算框架更适合实时数据处理和迭代计算?

A.MapReduce

B.Spark

C.Hive

D.HBase

【答案】:B

解析:本题考察大数据计算框架的特点。MapReduce是基于磁盘的批处理框架,适合离线计算(A错);Spark是内存计算框架,支持迭代计算和实时流处理,性能远优于MapReduce(B对);Hive是数据仓库工具,用于SQL化查询分析(C错);HBase是NoSQL数据库,用于随机读写(D错)。

7、大数据处理流程中,数据经过采集、清洗和转换后,通常进入哪个环节?

A.数据采集(重复环节)

B.数据存储

C.数据可视化

D.数据挖掘

【答案】:B

解析:本题考察大数据处理流程知识点。大数据典型处理流程为:数据采集→预处理(清洗、转换)→数据存储→数据分析/挖掘→数据可视化。数据经过清洗和转换后,进入数据存储环节,以便后续处理和分析。选项A为原始环节,C和D是后续环节,因此正确答案为B。

8、大数据的5V特征中,不包括以下哪一项?

A.Volume(数据量)

B.Velocity(处理速度)

C.Variety(数据多样性)

D.Accuracy(准确性)

【答案】:D

解析:本题考察大数据5V特征的核心概念。大数据5V特征通常定义为:Volume(数据量)、Velocity

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档