2026年国开电大大数据技术形考题库100道附参考答案（满分必刷）.docxVIP

下载本文档

0
0
约2.51万字
约 39页
2026-03-10 发布于河南
举报

2026年国开电大大数据技术形考题库100道附参考答案（满分必刷）.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、关于数据仓库与数据湖的区别，以下说法正确的是？

A.数据仓库仅存储结构化数据，数据湖可存储多种类型数据

B.数据仓库存储实时数据，数据湖仅存储历史数据

C.数据仓库适合实时分析，数据湖适合离线批处理分析

D.数据仓库和数据湖本质上没有区别，仅为名称差异

【答案】：A

解析：本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据，面向分析场景，经过清洗和整合；数据湖则是原始数据集合，支持存储结构化、半结构化和非结构化数据，保留原始数据形态。B选项错误，两者均可存储实时和历史数据；C选项错误，两者均支持实时或批处理分析；D选项错误，两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。

2、大数据的“4V”特征中，描述数据产生和处理速度快的是哪个特征？

A.Volume（数据容量）

B.Variety（数据多样性）

C.Velocity（数据速度）

D.Veracity（数据真实性）

【答案】：C

解析：本题考察大数据的基本特征知识点。大数据“4V”特征中，Velocity特指数据产生和处理的速度（如实时流数据处理）；Volume指数据规模巨大，Variety指数据类型多样（结构化、半结构化、非结构化），Veracity是数据质量维度（真实性），通常不属于4V核心特征。

3、以下关于Spark与MapReduce的对比，正确的是？

A.Spark只能处理批处理任务，无法处理流数据

B.Spark基于内存计算，比MapReduce更高效

C.Spark不支持分布式计算，仅适用于单机环境

D.Spark的编程模型比MapReduce更复杂

【答案】：B

解析：本题考察大数据计算框架知识点。A错误，Spark支持批处理（SparkBatch）、流处理（SparkStreaming）和交互式查询；B正确，MapReduce基于磁盘I/O执行Map和Reduce，Spark利用内存缓存数据，减少磁盘读写，计算效率更高；C错误，Spark是分布式计算框架，支持集群部署；D错误，Spark提供更简洁的API（如DataFrame、Dataset），编程模型比MapReduce更简单。因此选B。

4、以下哪项不属于大数据的4V核心特征？

A.Veracity（真实性）

B.Volume（规模）

C.Velocity（速度）

D.Variety（多样性）

【答案】：A

解析：本题考察大数据4V特征知识点。大数据的4V标准定义为Volume（数据规模）、Velocity（数据产生和处理速度）、Variety（数据类型多样性）、Value（数据价值密度）。Veracity（数据真实性）通常是扩展的“5V”特征之一，不属于4V核心定义，因此答案为A。

5、相比Hadoop的MapReduce，Spark的显著优势在于？

A.支持内存计算，迭代效率更高

B.仅适用于离线批处理场景

C.必须基于磁盘存储中间结果

D.无法处理实时流数据

【答案】：A

解析：本题考察Spark与MapReduce的对比知识点。Spark采用内存计算模型，中间结果无需频繁读写磁盘，迭代计算效率远高于MapReduce；Spark不仅支持批处理，还可处理实时流数据；MapReduce才需基于磁盘存储中间结果，故正确答案为A。

6、以下哪种数据类型不属于大数据中的非结构化数据？

A.文本文件

B.数据库表

C.图片文件

D.日志文件

【答案】：B

解析：本题考察大数据数据类型知识点。非结构化数据是指格式不固定、难以用二维表结构表示的数据，如文本、图片、视频、日志等。数据库表属于结构化数据，具有固定的字段和格式，因此不属于非结构化数据，正确答案为B。

7、大数据的5V特征中，“Velocity”指的是？

A.数据处理的速度（数据产生和流动的速度）

B.数据的规模（数据量大小）

C.数据的多样性（结构化与非结构化数据并存）

D.数据的价值密度（数据蕴含的价值）

【答案】：A

解析：本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume（数据量）、Velocity（速度）、Variety（多样性）、Veracity（准确性）、Value（价值）。选项A准确描述了Velocity的含义；B对应Volume，C对应Variety，D对应Value，均为错误选项。

8、以下哪种技术适用于实时流数据处理？

A.MapReduce（批处理框架）

B.SparkStreaming（流处理框架）

C.Hive（数据仓库工具）

D.HBase（分布式NoSQL数据库）

【答案】：B

解析：本题考察大数据处理技术应用场

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

2026年国开电大大数据技术形考题库100道附参考答案（满分必刷）.docxVIP