2026年国开电大大数据技术概论形考题库100道含答案(完整版).docxVIP

  • 0
  • 0
  • 约2.43万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道含答案(完整版).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、在Hadoop生态系统中,负责分布式计算任务调度与执行的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.ZooKeeper(分布式协调服务)

【答案】:B

解析:本题考察Hadoop生态系统核心组件知识点。HDFS是分布式存储组件,负责数据存储;MapReduce是分布式计算框架,核心功能是任务调度与执行;YARN是资源管理器,负责集群资源管理;ZooKeeper是分布式协调服务。因此正确答案为B。

2、Hadoop生态系统中,哪个组件负责分布式文件存储,是大数据存储的核心基础?

A.MapReduce

B.HDFS

C.YARN

D.Hive

【答案】:B

解析:本题考察Hadoop生态系统组件功能知识点。正确答案为B。解析:HDFS(分布式文件系统)是Hadoop的核心组件之一,基于分布式架构实现海量数据的可靠存储;A选项MapReduce是分布式计算框架,负责并行处理海量数据;C选项YARN是资源管理器,负责集群资源调度;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此B为正确选项。

3、HBase作为分布式数据库,其数据模型属于以下哪种类型?

A.关系型数据库(SQL)

B.NoSQL数据库

C.键值对数据库

D.文档型数据库

【答案】:B

解析:本题考察HBase数据模型类型知识点。HBase是基于HDFS的分布式列族数据库,属于NoSQL(非关系型)数据库范畴;A选项关系型数据库(如MySQL)采用表结构和SQL语言;C选项键值对数据库(如Redis)仅支持键值对存储,HBase是列族模型,属于更复杂的NoSQL类型;D选项文档型数据库(如MongoDB)以文档为单位存储数据。因此正确答案为B。

4、以下哪个是基于内存计算的大数据处理框架?

A.Hadoop

B.Spark

C.Hive

D.HBase

【答案】:B

解析:Hadoop的核心计算模型MapReduce基于磁盘I/O,处理速度较慢;Spark采用内存计算架构,减少磁盘操作,显著提升数据处理效率;Hive是数据仓库工具,HBase是分布式NoSQL数据库,均不基于内存计算。因此正确答案为B。

5、大数据的5V特征中,强调数据真实性和可信度的是以下哪一项?

A.Volume(规模)

B.Velocity(速度)

C.Veracity(真实性)

D.Value(价值)

【答案】:C

解析:本题考察大数据5V特征的定义。Volume指数据规模(如TB/PB级);Velocity指数据产生和处理的速度;Veracity强调数据的真实性和可信度(如数据清洗后确保的准确性);Value指数据的价值密度。因此正确答案为C,其他选项分别对应不同特征,不符合题干描述。

6、以下哪项是Hadoop分布式计算框架的核心组件?

A.MapReduce

B.Hive

C.HBase

D.Spark

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。MapReduce是Hadoop分布式计算框架的核心组件,负责分布式并行计算任务;Hive是基于Hadoop的数据仓库工具,HBase是分布式NoSQL数据库,Spark是独立的内存计算引擎,均不属于Hadoop分布式计算框架的核心组件。因此正确答案为A。

7、大数据的“Velocity”特性对应的中文含义是?

A.规模

B.速度

C.多样性

D.价值

【答案】:B

解析:本题考察大数据的5V特性知识点。大数据的5V特性包括Volume(规模)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值)。其中“Velocity”的中文含义为“速度”,描述数据产生和处理的快速性;A选项“规模”对应Volume,C选项“多样性”对应Variety,D选项“价值”对应Value。因此正确答案为B。

8、大数据的5V特征中,以下哪一项不属于大数据的典型特征?

A.Volume(数据量)

B.Variability(变异性)

C.Velocity(数据产生速度)

D.Value(数据价值)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的典型5V特征包括:Volume(海量数据量)、Velocity(高速处理速度)、Variety(数据多样性)、Veracity(数据真实性)、Value(数据价值密度)。选项B中的“Variability(变异性)”并非大数据的标准特征,因此B为错误选项。

9、以下哪项属于大数据数据挖掘的

文档评论(0)

1亿VIP精品文档

相关文档