2026年国开电大大数据技术形考题库100道及参考答案.docxVIP

  • 1
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于山东
  • 举报

2026年国开电大大数据技术形考题库100道及参考答案.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪项不属于大数据的基本特征?

A.Volume(规模)

B.Velocity(速度)

C.Veracity(真实性)

D.Variety(多样性)

【答案】:C

解析:本题考察大数据的4V特征知识点。大数据的基本特征通常指Volume(规模)、Velocity(速度)、Variety(多样性)、Value(价值),而Veracity(真实性)不属于其核心特征。其他选项均为大数据的关键特征,因此正确答案为C。

2、大数据的特征中,强调数据产生和处理速度快的是以下哪一项?

A.Volume(规模)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的5V特征中,Velocity(速度)指数据生成和处理的速度快,能够实时或近实时处理数据;A选项Volume是指数据规模大,通常以TB、PB衡量;C选项Variety是指数据类型多样,包括结构化、半结构化和非结构化数据;D选项Veracity是指数据的真实性和准确性,确保数据质量。因此正确答案为B。

3、下列哪项是大数据在交通领域的典型应用?

A.基于用户行为的电商智能推荐

B.城市实时交通流量预测与智能调度

C.医疗影像的自动诊断系统

D.社交媒体情感分析平台

【答案】:B

解析:本题考察大数据应用领域知识点。A项属于电商领域的个性化推荐,C项属于医疗领域的影像分析,D项属于社交领域的舆情监测,均非交通领域应用;B项通过实时分析交通数据(如车流量、车速)实现智能调度与预测,是大数据在交通领域的典型应用。

4、在数据预处理流程中,用于处理数据中的缺失值、异常值和重复数据的步骤是?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:A

解析:本题考察数据预处理步骤知识点。数据预处理包括多个关键步骤:A选项数据清洗主要用于处理数据中的质量问题,如缺失值填充、异常值处理、重复数据删除等,确保数据的准确性和一致性;B选项数据集成是将多个数据源的数据合并到一个统一的数据存储中;C选项数据转换是对数据进行格式转换、标准化或归一化等操作;D选项数据规约是通过降维或特征选择减少数据维度,提高处理效率。因此正确答案为A。

5、数据仓库中常用的逻辑模型包括以下哪些?

A.星型模型(事实表+维度表)

B.雪花模型(维度表分层)

C.星座模型(多个事实表共享维度表)

D.以上都是

【答案】:D

解析:本题考察数据仓库的逻辑模型知识点。数据仓库常用的逻辑模型包括:星型模型(最简单,单事实表+多维度表)、雪花模型(维度表进一步分层,更规范)、星座模型(多个事实表共享维度表,适用于复杂业务)。三者均为数据仓库的核心逻辑模型,因此正确答案为D。

6、在Hadoop生态系统中,负责分布式计算任务调度与资源管理的核心组件是?

A.HDFS(分布式文件系统)

B.YARN(资源管理器)

C.MapReduce(分布式计算框架)

D.Hive(数据仓库工具)

【答案】:B

解析:本题考察Hadoop生态系统核心组件功能。HDFS(A选项)是负责分布式文件存储的组件;YARN(B选项)是Hadoop2.x引入的资源管理器,主要负责集群资源的分配与任务调度;MapReduce(C选项)是基于YARN的分布式计算框架;Hive(D选项)是基于Hadoop的SQL查询工具。因此负责资源管理和调度的是YARN。

7、Spark作为大数据处理框架,相比HadoopMapReduce的核心优势是?

A.基于内存计算,处理速度更快

B.仅支持结构化数据处理

C.只能进行离线批处理

D.必须运行在分布式文件系统HDFS上

【答案】:A

解析:本题考察Spark与HadoopMapReduce的技术差异。Spark的核心优势是基于内存计算,避免了HadoopMapReduce的磁盘IO瓶颈,因此处理速度更快(尤其适合迭代计算和实时分析)。B选项错误,Spark支持结构化、半结构化(如JSON)、非结构化(如文本)等多种数据类型;C选项错误,Spark不仅支持批处理,还支持SparkStreaming实时计算;D选项错误,Spark可运行在本地、YARN、Kubernetes等多种环境,不依赖HDFS。

8、Spark作为大数据处理框架,其相比HadoopMapReduce的显著优势在于?

A.支持内存计算,处理速度更快

B.仅适用于批处理任务

C.只能运行在HDFS之上

D.不支持实时数据处理

【答案】:A

解析:本题考察Spark与MapReduce的对比知

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档