2026年国开电大大数据技术概论形考题库100道附答案(巩固).docxVIP

  • 1
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于山东
  • 举报

2026年国开电大大数据技术概论形考题库100道附答案(巩固).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据的5V特征中,哪一项是指数据量巨大,是大数据最直观的特征?

A.Volume

B.Velocity

C.Variety

D.Veracity

【答案】:A

解析:本题考察大数据的5V特征知识点。正确答案为A。解析:大数据的5V特征中,Volume(数据量)是指数据规模巨大,通常以PB、EB级衡量,是大数据最直观的特征;B选项Velocity(速度)指数据产生和处理的速度极快(如实时数据流);C选项Variety(多样性)指数据类型多样(结构化、半结构化、非结构化);D选项Veracity(真实性)指数据的准确性和可信度。因此A为正确选项。

2、在大数据处理流程中,对数据进行去重、填补缺失值、处理异常值等操作属于以下哪个环节?

A.数据集成

B.数据清洗

C.数据转换

D.数据规约

【答案】:B

解析:本题考察大数据预处理环节知识点。数据清洗是预处理的核心步骤,主要通过去重、填补缺失值、处理异常值等操作提升数据质量;数据集成是合并多源数据,数据转换是调整数据格式/范围,数据规约是压缩数据规模。因此正确答案为B。

3、大数据的哪个特征是指数据产生和处理的速度快?

A.速度(Velocity)

B.容量(Volume)

C.多样性(Variety)

D.价值(Value)

【答案】:A

解析:本题考察大数据的4V特征知识点。大数据的Velocity特征特指数据产生和处理的速度快(如实时流数据处理场景);Volume指数据量巨大(PB级以上),Variety指数据类型多样(结构化、半结构化、非结构化),Value指从海量数据中挖掘潜在价值。因此正确答案为A。

4、Hadoop生态系统中,哪个组件负责分布式文件存储?

A.MapReduce

B.HDFS

C.YARN

D.Hive

【答案】:B

解析:本题考察Hadoop生态系统组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,用于在集群中存储海量数据;A选项MapReduce是分布式计算框架,负责并行任务处理;C选项YARN是资源管理器,负责集群资源调度;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此正确答案为B。

5、Spark作为大数据处理框架,相比MapReduce的主要优势是?

A.基于内存计算,处理速度更快

B.只能处理结构化数据,效率更高

C.仅支持实时流数据处理,延迟更低

D.不需要分布式存储支持,部署更简单

【答案】:A

解析:本题考察Spark与MapReduce的核心差异。Spark采用内存计算模型,减少磁盘IO操作,因此处理速度远快于MapReduce的磁盘迭代计算;B选项错误,Spark支持结构化、半结构化、非结构化等多种数据类型;C选项错误,Spark既支持批处理也支持流处理(如StructuredStreaming);D选项错误,Spark依赖分布式存储(如HDFS)进行数据读写。因此正确答案为A。

6、以下哪个工具是Apache开源的,专为大规模数据处理设计的内存计算框架,支持批处理和流处理?

A.Hadoop

B.Spark

C.Flume

D.Hive

【答案】:B

解析:本题考察大数据处理工具特性。Spark是基于内存计算的快速大数据引擎,支持批处理(如SparkSQL)和流处理(SparkStreaming);A选项Hadoop是早期分布式计算生态,MapReduce基于磁盘且性能较低;C选项Flume是日志采集工具;D选项Hive是基于Hadoop的数据仓库工具,侧重SQL查询。正确答案为B。

7、以下哪种是典型的批处理大数据计算框架?

A.SparkStreaming

B.Storm

C.MapReduce

D.Flink

【答案】:C

解析:本题考察大数据计算框架类型。选项C的MapReduce是Hadoop生态系统中经典的批处理计算模型,适用于离线数据处理;选项A的SparkStreaming是实时流处理框架;选项B的Storm是实时流处理框架;选项D的Flink是兼具流处理和批处理能力的框架,但批处理并非其典型代表。因此正确答案为C。

8、以下哪个应用场景体现了大数据在交通领域的典型应用?

A.电商平台的智能推荐系统

B.城市交通流量实时监控与动态调度

C.医院的电子病历分析

D.金融机构的风险评估模型

【答案】:B

解析:城市交通流量实时监控与调度通过大数据采集实时路况、历史数据,实现动态调度,属于交通领域典型应用;A属于电商推荐算法;C属于医疗大数据;D属于金融风险评估。因此

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档