- 0
- 0
- 约2.5万字
- 约 39页
- 2026-03-10 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、以下哪种技术适用于实时流数据处理?
A.MapReduce(批处理框架)
B.SparkStreaming(流处理框架)
C.Hive(数据仓库工具)
D.HBase(分布式NoSQL数据库)
【答案】:B
解析:本题考察大数据处理技术应用场景知识点。SparkStreaming是专为实时流数据设计的框架,可对持续产生的数据流进行毫秒级或秒级实时分析;A选项MapReduce是经典批处理框架,适用于离线海量数据计算;C选项Hive基于批处理引擎(如MapReduce),主要用于离线数据分析;D选项HBase是分布式数据库,用于存储非结构化数据而非处理流数据。因此正确答案为B。
2、大数据的5V特征中,“Velocity”指的是?
A.数据处理的速度(数据产生和流动的速度)
B.数据的规模(数据量大小)
C.数据的多样性(结构化与非结构化数据并存)
D.数据的价值密度(数据蕴含的价值)
【答案】:A
解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。
3、Hadoop生态系统中负责分布式文件存储的核心组件是?
A.MapReduce(分布式计算框架)
B.YARN(资源管理器)
C.HDFS(分布式文件系统)
D.Hive(数据仓库工具)
【答案】:C
解析:本题考察Hadoop核心组件知识点。HDFS是Hadoop的分布式文件系统,负责海量数据的分布式存储;MapReduce是分布式计算框架,YARN负责集群资源管理与任务调度,Hive是基于Hadoop的数据仓库工具(非核心存储组件)。
4、Spark相比MapReduce,在数据处理上的主要优势是?
A.仅支持批处理任务
B.基于内存计算,处理速度更快
C.必须依赖磁盘进行所有中间结果存储
D.仅能处理结构化数据
【答案】:B
解析:本题考察Spark与MapReduce的技术对比。Spark采用内存计算模型,中间结果暂存内存,大幅减少磁盘I/O,处理速度远快于MapReduce(后者依赖磁盘存储中间结果);Spark不仅支持批处理,还支持流处理(如SparkStreaming)等多种任务;且Spark对结构化、半结构化、非结构化数据均有良好支持。因此正确答案为B。
5、以下哪项不属于大数据的5V特性?
A.Volume
B.Velocity
C.Value
D.Variable
【答案】:D
解析:本题考察大数据5V特性知识点。大数据的5V特性为Volume(容量)、Velocity(速度)、Variety(多样性)、Veracity(真实性)、Value(价值),Variable(变量)不属于5V特性,因此正确答案为D。
6、在Hadoop生态系统中,负责分布式存储海量数据的核心组件是?
A.HDFS(Hadoop分布式文件系统)
B.MapReduce(分布式计算框架)
C.YARN(资源管理器)
D.ZooKeeper(分布式协调服务)
【答案】:A
解析:本题考察Hadoop生态系统核心组件知识点。HDFS(Hadoop分布式文件系统)是Hadoop生态的基础,专为分布式存储海量数据设计;MapReduce是分布式计算框架,YARN负责资源管理与调度,ZooKeeper用于分布式协调,因此负责分布式存储的是HDFS,正确选项A。
7、数据预处理中,“去除数据中的噪声、缺失值、重复值”属于哪个环节?
A.数据清洗
B.数据集成
C.数据转换
D.数据规约
【答案】:A
解析:本题考察数据预处理步骤知识点。数据清洗的核心是处理原始数据中的质量问题,包括去除噪声(异常值)、缺失值填充、重复值删除等;数据集成是合并多源数据;数据转换是对数据格式、单位等进行转换;数据规约是在保证信息完整的前提下减少数据规模。因此正确答案为A。
8、以下哪项不属于大数据在智慧城市建设中的典型应用场景?
A.智能交通信号优化(基于实时车流量数据)
B.城市空气质量实时监测与预警(大数据分析污染数据)
C.传统人工窗口办理政务(依赖人工操作,非大数据驱动)
D.公共安全视频监控智能分析(异常行为识别)
【答案】:C
解析:本题考察大数据在智慧城市领域的应用场景知识点。智能交通、空气质量监测、公共安全监控均是大数据典型应用(通过海量数据实时分析优化决策);而“传统人工窗口办理政务”依赖人工流
您可能关注的文档
最近下载
- 22S804矩形钢筋混凝土蓄水池.pdf VIP
- TCIC 049-2021 水泥窑用固体替代燃料.docx VIP
- 人民高中历史必修一同步练习材料题: 专制时代晚期的政治形态 含答案.doc VIP
- (新编)农村集体经济组织换届选举操作实务与示范文本资料汇编.doc VIP
- 80后农村孩子童年的记忆.doc VIP
- 二级公路沥青路面施工质量控制.doc VIP
- 6种儿童营养筛查评估量表详解(附中文评分表).docx VIP
- 数学项目化学习的特征及教学策略.docx VIP
- 2025年国家义务教育质量监测小学四年级艺术(音乐美术)国测模拟测试题.docx VIP
- 《数字化测图》全套教学课件.pptx
原创力文档

文档评论(0)