2026年国开电大大数据技术形考题库100道及参考答案.docxVIP

下载本文档

1
0
约2.45万字
约 39页
2026-03-09 发布于山东
举报

2026年国开电大大数据技术形考题库100道及参考答案.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪项不属于大数据的基本特征？

A.Volume（规模）

B.Velocity（速度）

C.Veracity（真实性）

D.Variety（多样性）

【答案】：C

解析：本题考察大数据的4V特征知识点。大数据的基本特征通常指Volume（规模）、Velocity（速度）、Variety（多样性）、Value（价值），而Veracity（真实性）不属于其核心特征。其他选项均为大数据的关键特征，因此正确答案为C。

2、大数据的特征中，强调数据产生和处理速度快的是以下哪一项？

A.Volume（规模）

B.Velocity（速度）

C.Variety（多样性）

D.Veracity（真实性）

【答案】：B

解析：本题考察大数据的5V特征知识点。大数据的5V特征中，Velocity（速度）指数据生成和处理的速度快，能够实时或近实时处理数据；A选项Volume是指数据规模大，通常以TB、PB衡量；C选项Variety是指数据类型多样，包括结构化、半结构化和非结构化数据；D选项Veracity是指数据的真实性和准确性，确保数据质量。因此正确答案为B。

3、下列哪项是大数据在交通领域的典型应用？

A.基于用户行为的电商智能推荐

B.城市实时交通流量预测与智能调度

C.医疗影像的自动诊断系统

D.社交媒体情感分析平台

【答案】：B

解析：本题考察大数据应用领域知识点。A项属于电商领域的个性化推荐，C项属于医疗领域的影像分析，D项属于社交领域的舆情监测，均非交通领域应用；B项通过实时分析交通数据（如车流量、车速）实现智能调度与预测，是大数据在交通领域的典型应用。

4、在数据预处理流程中，用于处理数据中的缺失值、异常值和重复数据的步骤是？

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】：A

解析：本题考察数据预处理步骤知识点。数据预处理包括多个关键步骤：A选项数据清洗主要用于处理数据中的质量问题，如缺失值填充、异常值处理、重复数据删除等，确保数据的准确性和一致性；B选项数据集成是将多个数据源的数据合并到一个统一的数据存储中；C选项数据转换是对数据进行格式转换、标准化或归一化等操作；D选项数据规约是通过降维或特征选择减少数据维度，提高处理效率。因此正确答案为A。

5、数据仓库中常用的逻辑模型包括以下哪些？

A.星型模型（事实表+维度表）

B.雪花模型（维度表分层）

C.星座模型（多个事实表共享维度表）

D.以上都是

【答案】：D

解析：本题考察数据仓库的逻辑模型知识点。数据仓库常用的逻辑模型包括：星型模型（最简单，单事实表+多维度表）、雪花模型（维度表进一步分层，更规范）、星座模型（多个事实表共享维度表，适用于复杂业务）。三者均为数据仓库的核心逻辑模型，因此正确答案为D。

6、在Hadoop生态系统中，负责分布式计算任务调度与资源管理的核心组件是？

A.HDFS（分布式文件系统）

B.YARN（资源管理器）

C.MapReduce（分布式计算框架）

D.Hive（数据仓库工具）

【答案】：B

解析：本题考察Hadoop生态系统核心组件功能。HDFS（A选项）是负责分布式文件存储的组件；YARN（B选项）是Hadoop2.x引入的资源管理器，主要负责集群资源的分配与任务调度；MapReduce（C选项）是基于YARN的分布式计算框架；Hive（D选项）是基于Hadoop的SQL查询工具。因此负责资源管理和调度的是YARN。

7、Spark作为大数据处理框架，相比HadoopMapReduce的核心优势是？

A.基于内存计算，处理速度更快

B.仅支持结构化数据处理

C.只能进行离线批处理

D.必须运行在分布式文件系统HDFS上

【答案】：A

解析：本题考察Spark与HadoopMapReduce的技术差异。Spark的核心优势是基于内存计算，避免了HadoopMapReduce的磁盘IO瓶颈，因此处理速度更快（尤其适合迭代计算和实时分析）。B选项错误，Spark支持结构化、半结构化（如JSON）、非结构化（如文本）等多种数据类型；C选项错误，Spark不仅支持批处理，还支持SparkStreaming实时计算；D选项错误，Spark可运行在本地、YARN、Kubernetes等多种环境，不依赖HDFS。

8、Spark作为大数据处理框架，其相比HadoopMapReduce的显著优势在于？

A.支持内存计算，处理速度更快

B.仅适用于批处理任务

C.只能运行在HDFS之上

D.不支持实时数据处理

【答案】：A

解析：本题考察Spark与MapReduce的对比知

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年国开电大大数据技术形考题库100道及参考答案.docxVIP