2026年国开电大大数据技术概论形考题库100道及参考答案(基础题).docxVIP

  • 1
  • 0
  • 约2.51万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及参考答案(基础题).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据的5V特征中,以下哪一项不属于大数据的典型特征?

A.Volume(数据量)

B.Variability(变异性)

C.Velocity(数据产生速度)

D.Value(数据价值)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的典型5V特征包括:Volume(海量数据量)、Velocity(高速处理速度)、Variety(数据多样性)、Veracity(数据真实性)、Value(数据价值密度)。选项B中的“Variability(变异性)”并非大数据的标准特征,因此B为错误选项。

2、以下哪项属于大数据中的非结构化数据?

A.关系型数据库中的用户信息表

B.医院的电子病历文本

C.企业ERP系统中的结构化销售数据

D.金融交易记录的结构化表格

【答案】:B

解析:本题考察大数据数据类型知识点。非结构化数据无固定格式和预定义结构,如文本、图片、音频等;结构化数据有明确字段和格式,如关系型数据库表、结构化表格。选项A、C、D均为结构化数据,选项B“电子病历文本”属于无固定格式的非结构化数据,因此正确答案为B。

3、以下哪项不属于大数据的5V特征?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Validity(有效性)

【答案】:D

解析:本题考察大数据的5V特征知识点。大数据5V特征为:Volume(数据容量大)、Velocity(处理速度快)、Variety(数据类型多样)、Veracity(数据真实可靠)、Value(数据价值密度低但总体价值高)。选项D的Validity(有效性)不属于5V特征,因此正确答案为D。

4、以下哪项属于大数据数据采集阶段的技术工具?

A.Flume

B.Hive

C.Spark

D.HDFS

【答案】:A

解析:本题考察大数据数据采集技术。选项A的Flume是Cloudera开源的分布式日志采集工具,属于数据采集阶段的技术;选项B的Hive是基于Hadoop的数据仓库工具,用于数据存储与分析;选项C的Spark是内存计算框架,用于数据处理;选项D的HDFS是分布式文件系统,用于数据存储。因此正确答案为A。

5、在Hadoop生态系统中,负责存储海量分布式数据的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专为存储海量数据设计,支持大文件和高容错性;MapReduce是分布式计算框架,负责并行处理数据;YARN负责集群资源管理和任务调度;Hive是基于Hadoop的数据仓库工具,用于SQL类查询。因此正确答案为A。

6、关于大数据的基本特点,以下描述正确的是?

A.大数据仅包含结构化数据(包含非结构化数据)

B.大数据的数据量必须超过100TB(无固定阈值)

C.大数据处理需满足低延迟要求(批处理框架延迟高)

D.大数据具有“4V”特征中的Velocity(处理速度)

【答案】:D

解析:本题考察大数据的核心特点。A错误,大数据包含结构化、半结构化、非结构化数据;B错误,大数据无固定数据量阈值,仅强调规模远超传统工具处理能力;C错误,批处理框架(如MapReduce)对实时性要求低,大数据的Velocity特征强调“处理速度”但不绝对要求低延迟;D正确,大数据“4V”特征包含Velocity(处理速度),因此正确答案为D。

7、在Hadoop生态系统中,负责存储海量结构化与非结构化数据的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop核心组件功能。正确答案为A,HDFS(HadoopDistributedFileSystem)是分布式文件系统,专为存储海量数据设计,支持高容错、高吞吐量的文件存储。B选项MapReduce是分布式计算框架,负责数据处理逻辑;C选项YARN是资源管理器,协调集群资源分配;D选项Hive是基于Hadoop的数据仓库工具,用于数据建模和查询。因此A是存储数据的核心组件。

8、大数据的“5V”特征中,“Volume”对应的中文含义是?

A.数据量大小

B.数据处理速度

C.数据来源多样性

D.数据准确性

【答案】:A

解析:本题考察大数据的5V特征知

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档