2026年国开电大大数据技术概论形考题库100道附参考答案(巩固).docxVIP

  • 0
  • 0
  • 约2.47万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道附参考答案(巩固).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据的4V特征中,“Volume”指的是数据的什么特性?

A.数据量巨大

B.数据处理速度快

C.数据类型多样

D.数据价值密度高

【答案】:A

解析:本题考察大数据的基本特征知识点。大数据的4V特征包括:Volume(容量/数据量巨大)、Velocity(速度/处理速度快)、Variety(多样性/数据类型多样)、Value(价值/低价值密度但蕴含潜在价值)。选项B对应Velocity,选项C对应Variety,选项D描述错误(大数据通常低价值密度),因此正确答案为A。

2、大数据的5V特征中,以下哪一项不属于大数据的典型特征?

A.Volume(数据量)

B.Variability(变异性)

C.Velocity(数据产生速度)

D.Value(数据价值)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的典型5V特征包括:Volume(海量数据量)、Velocity(高速处理速度)、Variety(数据多样性)、Veracity(数据真实性)、Value(数据价值密度)。选项B中的“Variability(变异性)”并非大数据的标准特征,因此B为错误选项。

3、在Hadoop生态系统中,负责分布式计算任务调度与资源管理的核心组件是?

A.HDFS(分布式文件存储)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:C

解析:YARN(YetAnotherResourceNegotiator)是Hadoop2.x引入的核心组件,负责集群资源的分配、调度及计算任务的管理;HDFS是分布式文件系统,用于存储数据;MapReduce是早期分布式计算框架;Hive是基于Hadoop的数据仓库工具。因此正确答案为C。

4、大数据的5V特征中,不包括以下哪一项?

A.Variety(多样性)

B.Velocity(速度)

C.Value(价值)

D.Viscosity(粘度)

【答案】:D

解析:本题考察大数据的5V特征知识点。大数据的5V特征标准定义为Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值),而“Viscosity(粘度)”并非大数据特征范畴,属于干扰项。因此正确答案为D。

5、数据预处理的主要目的是?

A.直接生成最终分析结果

B.提高数据质量,以便后续分析和挖掘

C.降低数据存储成本

D.加速数据传输速度

【答案】:B

解析:本题考察大数据数据预处理的目的。数据预处理是对原始数据进行清洗、去重、缺失值处理、格式转换等操作,核心目的是去除噪声、填补缺陷、统一数据格式,从而提高数据质量,为后续分析和挖掘提供可靠基础。选项A(直接生成结果)过于绝对,预处理是基础步骤而非直接结果;选项C(降低存储成本)和D(加速传输)不是主要目的,因此正确答案为B。

6、以下哪个应用场景最能体现大数据的‘高速’(Velocity)特征?

A.传统银行柜台业务处理

B.实时交通流量监控与导航

C.企业历史数据归档

D.纸质文件扫描存储

【答案】:B

解析:大数据Velocity特征强调数据处理的高速性。实时交通流量监控需对实时数据流快速采集、分析并反馈导航,体现‘高速’要求。A选项处理速度慢,C选项离线归档,D选项仅存储,均不涉及实时处理。因此正确答案为B。

7、以下哪一项不属于Hadoop生态系统的核心组件?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.Spark(分布式计算引擎)

D.YARN(资源管理器)

【答案】:C

解析:本题考察Hadoop生态系统核心组件知识点。Hadoop生态系统核心包括HDFS(分布式存储)、MapReduce/YARN(分布式计算与资源管理);C选项Spark是独立的开源大数据计算框架,虽与Hadoop同属大数据技术栈,但不属于Hadoop生态系统的核心组件;A、B、D均为Hadoop生态的核心模块。因此正确答案为C。

8、以下哪项不属于NoSQL数据库的特点?

A.通常不严格遵循ACID特性

B.支持分布式架构和高扩展性

C.适合存储非结构化或半结构化数据

D.完全兼容SQL语法

【答案】:D

解析:本题考察NoSQL数据库的核心特点知识点。NoSQL数据库(非关系型数据库)的特点包括:支持分布式存储和高扩展性(B正确),适合存储非结构化/半结构化数据(如文档、图片等,C正确),通常采用BASE特性(不严格遵循ACID,A正确)。而SQL语法是关系型数据库的标准语法,No

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档