- 0
- 0
- 约2.48万字
- 约 39页
- 2026-03-10 发布于宁夏
- 举报
2026年国开电大大数据技术概论形考题库100道
第一部分单选题(100题)
1、以下哪种技术是基于内存计算的快速大数据处理框架,适用于批处理和流处理场景?
A.HadoopMapReduce
B.ApacheSpark
C.ApacheStorm
D.ApacheFlink
【答案】:B
解析:本题考察大数据关键技术框架知识点。正确答案为B。解析:ApacheSpark是基于内存计算的分布式计算框架,相比HadoopMapReduce(基于磁盘,速度慢),Spark通过内存存储中间结果,处理速度提升数倍,且支持批处理(如离线分析)和流处理(如SparkStreaming);A选项HadoopMapReduce是早期分布式批处理框架,依赖磁盘I/O,性能较低;C选项Storm和D选项Flink是专注于实时流处理的框架,主要用于低延迟场景(如实时监控告警),而Spark更侧重快速批处理和统一的处理引擎。因此B为正确选项。
2、在大数据处理流程中,用于处理数据缺失值、异常值及重复数据的步骤是?
A.数据清洗
B.数据集成
C.数据转换
D.数据规约
【答案】:A
解析:本题考察大数据处理流程中的数据预处理步骤知识点。数据清洗的核心作用是去除或修正数据中的噪声、缺失值、异常值及重复数据,保障数据质量;数据集成是合并多源数据,数据转换是统一数据格式,数据规约是降低数据规模,均与处理缺失值无关。因此正确答案为A。
3、大数据技术中,通常所说的‘4V’核心特征不包括以下哪一项?
A.数据量(Volume)
B.数据速度(Velocity)
C.数据多样性(Variety)
D.数据真实性(Veracity)
【答案】:D
解析:本题考察大数据‘4V’特征的基本概念。大数据经典‘4V’特征为:数据量(Volume,指数据规模庞大)、数据速度(Velocity,指数据产生和处理的速度快)、数据多样性(Variety,指数据类型多样,如结构化、半结构化、非结构化)、数据价值(Value,指从海量数据中挖掘潜在价值)。选项D的‘数据真实性(Veracity)’是后期扩展的特征,并非‘4V’核心定义,因此正确答案为D。
4、以下哪种技术属于大数据批处理计算框架?
A.MapReduce
B.SparkStreaming
C.Flink
D.KafkaStreams
【答案】:A
解析:本题考察大数据处理框架的分类。MapReduce是Hadoop生态中经典的批处理计算框架,适用于离线数据处理;B选项SparkStreaming是基于Spark的流处理框架,属于实时流处理;C选项Flink是开源流处理框架,支持高吞吐低延迟的流处理;D选项KafkaStreams是基于Kafka的流处理库,因此正确答案为A。
5、Hadoop生态系统中,用于分布式存储海量数据的核心组件是?
A.MapReduce
B.HDFS
C.YARN
D.HBase
【答案】:B
解析:本题考察Hadoop生态系统核心组件知识点。HDFS(B)是Hadoop分布式文件系统,负责海量数据的分布式存储;MapReduce(A)是分布式计算框架;YARN(C)是资源管理器,负责集群资源调度;HBase(D)是分布式NoSQL数据库,用于随机读写海量结构化数据。因此正确答案为B。
6、在Hadoop生态系统中,负责分布式计算任务调度和资源管理的核心组件是?
A.HDFS(分布式文件系统)
B.MapReduce(计算模型)
C.YARN(YetAnotherResourceNegotiator)
D.Hive(数据仓库工具)
【答案】:C
解析:本题考察Hadoop生态系统核心组件功能。YARN(YetAnotherResourceNegotiator)是Hadoop2.x版本引入的资源管理器,负责集群资源(CPU、内存等)的分配与调度,协调MapReduce等任务的执行。A选项HDFS是分布式存储系统;B选项MapReduce是分布式计算框架,负责并行计算任务;D选项Hive是基于Hadoop的数据仓库工具,用于SQL查询,均不符合题意。
7、大数据的4V特征不包括以下哪一项?
A.Volume(容量)
B.Velocity(速度)
C.Veracity(真实性)
D.Value(价值)
【答案】:C
解析:本题考察大数据的4V特征知识点。大数据的核心特征通常定义为4V:Volume(数据量巨大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(蕴含高价值)。选项C的Veracity(真实性)不属于4V特征,因此正确答案为C。
8、以下哪种计算模
您可能关注的文档
- 2026年国开电大当代中国政治制度形考题库100道含答案【综合题】.docx
- 2026年国开电大导游业务形考题库100道附答案(培优b卷).docx
- 2026年国开电大导游业务形考题库100道及答案【夺冠】.docx
- 2026年国开电大大数据技术概论形考题库100道附答案(综合卷).docx
- 2026年国开电大大数据技术形考题库100道附答案(典型题).docx
- 2026年国开电大大数据技术形考题库100道及答案(全优).docx
- 2026年国开电大大作业形考题库100道(典型题).docx
- 2026年国开电大大作业形考题库100道含答案【突破训练】.docx
- 2026年国开电大创业机会与商业模式形考题库100道及答案【全国通用】.docx
- 2026年国开电大创业教育(创业教育专)形考题库100道含答案【完整版】.docx
原创力文档

文档评论(0)