2026年国开电大大数据技术形考题库100道附参考答案(满分必刷).docxVIP

  • 0
  • 0
  • 约2.51万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道附参考答案(满分必刷).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、关于数据仓库与数据湖的区别,以下说法正确的是?

A.数据仓库仅存储结构化数据,数据湖可存储多种类型数据

B.数据仓库存储实时数据,数据湖仅存储历史数据

C.数据仓库适合实时分析,数据湖适合离线批处理分析

D.数据仓库和数据湖本质上没有区别,仅为名称差异

【答案】:A

解析:本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据,面向分析场景,经过清洗和整合;数据湖则是原始数据集合,支持存储结构化、半结构化和非结构化数据,保留原始数据形态。B选项错误,两者均可存储实时和历史数据;C选项错误,两者均支持实时或批处理分析;D选项错误,两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。

2、大数据的“4V”特征中,描述数据产生和处理速度快的是哪个特征?

A.Volume(数据容量)

B.Variety(数据多样性)

C.Velocity(数据速度)

D.Veracity(数据真实性)

【答案】:C

解析:本题考察大数据的基本特征知识点。大数据“4V”特征中,Velocity特指数据产生和处理的速度(如实时流数据处理);Volume指数据规模巨大,Variety指数据类型多样(结构化、半结构化、非结构化),Veracity是数据质量维度(真实性),通常不属于4V核心特征。

3、以下关于Spark与MapReduce的对比,正确的是?

A.Spark只能处理批处理任务,无法处理流数据

B.Spark基于内存计算,比MapReduce更高效

C.Spark不支持分布式计算,仅适用于单机环境

D.Spark的编程模型比MapReduce更复杂

【答案】:B

解析:本题考察大数据计算框架知识点。A错误,Spark支持批处理(SparkBatch)、流处理(SparkStreaming)和交互式查询;B正确,MapReduce基于磁盘I/O执行Map和Reduce,Spark利用内存缓存数据,减少磁盘读写,计算效率更高;C错误,Spark是分布式计算框架,支持集群部署;D错误,Spark提供更简洁的API(如DataFrame、Dataset),编程模型比MapReduce更简单。因此选B。

4、以下哪项不属于大数据的4V核心特征?

A.Veracity(真实性)

B.Volume(规模)

C.Velocity(速度)

D.Variety(多样性)

【答案】:A

解析:本题考察大数据4V特征知识点。大数据的4V标准定义为Volume(数据规模)、Velocity(数据产生和处理速度)、Variety(数据类型多样性)、Value(数据价值密度)。Veracity(数据真实性)通常是扩展的“5V”特征之一,不属于4V核心定义,因此答案为A。

5、相比Hadoop的MapReduce,Spark的显著优势在于?

A.支持内存计算,迭代效率更高

B.仅适用于离线批处理场景

C.必须基于磁盘存储中间结果

D.无法处理实时流数据

【答案】:A

解析:本题考察Spark与MapReduce的对比知识点。Spark采用内存计算模型,中间结果无需频繁读写磁盘,迭代计算效率远高于MapReduce;Spark不仅支持批处理,还可处理实时流数据;MapReduce才需基于磁盘存储中间结果,故正确答案为A。

6、以下哪种数据类型不属于大数据中的非结构化数据?

A.文本文件

B.数据库表

C.图片文件

D.日志文件

【答案】:B

解析:本题考察大数据数据类型知识点。非结构化数据是指格式不固定、难以用二维表结构表示的数据,如文本、图片、视频、日志等。数据库表属于结构化数据,具有固定的字段和格式,因此不属于非结构化数据,正确答案为B。

7、大数据的5V特征中,“Velocity”指的是?

A.数据处理的速度(数据产生和流动的速度)

B.数据的规模(数据量大小)

C.数据的多样性(结构化与非结构化数据并存)

D.数据的价值密度(数据蕴含的价值)

【答案】:A

解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。

8、以下哪种技术适用于实时流数据处理?

A.MapReduce(批处理框架)

B.SparkStreaming(流处理框架)

C.Hive(数据仓库工具)

D.HBase(分布式NoSQL数据库)

【答案】:B

解析:本题考察大数据处理技术应用场

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档