2026年国开电大大数据技术形考题库100道及一套参考答案.docxVIP

  • 0
  • 0
  • 约2.5万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及一套参考答案.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪种技术适用于实时流数据处理?

A.MapReduce(批处理框架)

B.SparkStreaming(流处理框架)

C.Hive(数据仓库工具)

D.HBase(分布式NoSQL数据库)

【答案】:B

解析:本题考察大数据处理技术应用场景知识点。SparkStreaming是专为实时流数据设计的框架,可对持续产生的数据流进行毫秒级或秒级实时分析;A选项MapReduce是经典批处理框架,适用于离线海量数据计算;C选项Hive基于批处理引擎(如MapReduce),主要用于离线数据分析;D选项HBase是分布式数据库,用于存储非结构化数据而非处理流数据。因此正确答案为B。

2、大数据的5V特征中,“Velocity”指的是?

A.数据处理的速度(数据产生和流动的速度)

B.数据的规模(数据量大小)

C.数据的多样性(结构化与非结构化数据并存)

D.数据的价值密度(数据蕴含的价值)

【答案】:A

解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。

3、Hadoop生态系统中负责分布式文件存储的核心组件是?

A.MapReduce(分布式计算框架)

B.YARN(资源管理器)

C.HDFS(分布式文件系统)

D.Hive(数据仓库工具)

【答案】:C

解析:本题考察Hadoop核心组件知识点。HDFS是Hadoop的分布式文件系统,负责海量数据的分布式存储;MapReduce是分布式计算框架,YARN负责集群资源管理与任务调度,Hive是基于Hadoop的数据仓库工具(非核心存储组件)。

4、Spark相比MapReduce,在数据处理上的主要优势是?

A.仅支持批处理任务

B.基于内存计算,处理速度更快

C.必须依赖磁盘进行所有中间结果存储

D.仅能处理结构化数据

【答案】:B

解析:本题考察Spark与MapReduce的技术对比。Spark采用内存计算模型,中间结果暂存内存,大幅减少磁盘I/O,处理速度远快于MapReduce(后者依赖磁盘存储中间结果);Spark不仅支持批处理,还支持流处理(如SparkStreaming)等多种任务;且Spark对结构化、半结构化、非结构化数据均有良好支持。因此正确答案为B。

5、以下哪项不属于大数据的5V特性?

A.Volume

B.Velocity

C.Value

D.Variable

【答案】:D

解析:本题考察大数据5V特性知识点。大数据的5V特性为Volume(容量)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值),Variable(变量)不属于5V特性,因此正确答案为D。

6、在Hadoop生态系统中,负责分布式存储海量数据的核心组件是?

A.HDFS(Hadoop分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.ZooKeeper(分布式协调服务)

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(Hadoop分布式文件系统)是Hadoop生态的基础,专为分布式存储海量数据设计;MapReduce是分布式计算框架,YARN负责资源管理与调度,ZooKeeper用于分布式协调,因此负责分布式存储的是HDFS,正确选项A。

7、数据预处理中,“去除数据中的噪声、缺失值、重复值”属于哪个环节?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:A

解析:本题考察数据预处理步骤知识点。数据清洗的核心是处理原始数据中的质量问题,包括去除噪声(异常值)、缺失值填充、重复值删除等;数据集成是合并多源数据;数据转换是对数据格式、单位等进行转换;数据规约是在保证信息完整的前提下减少数据规模。因此正确答案为A。

8、以下哪项不属于大数据在智慧城市建设中的典型应用场景?

A.智能交通信号优化(基于实时车流量数据)

B.城市空气质量实时监测与预警(大数据分析污染数据)

C.传统人工窗口办理政务(依赖人工操作,非大数据驱动)

D.公共安全视频监控智能分析(异常行为识别)

【答案】:C

解析:本题考察大数据在智慧城市领域的应用场景知识点。智能交通、空气质量监测、公共安全监控均是大数据典型应用(通过海量数据实时分析优化决策);而“传统人工窗口办理政务”依赖人工流

文档评论(0)

1亿VIP精品文档

相关文档