2026年国开电大大数据技术概论形考题库100道附参考答案【巩固】.docxVIP

  • 0
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道附参考答案【巩固】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据处理流程中,首先需要执行的关键步骤是以下哪一项?

A.数据存储(将数据持久化到存储系统)

B.数据采集(从各类数据源获取原始数据)

C.数据清洗(去除数据中的噪声和异常值)

D.数据挖掘(从数据中提取有价值信息)

【答案】:B

解析:本题考察大数据处理基本流程知识点。正确答案为B,数据采集是大数据处理的起始环节,只有先从传感器、日志、数据库等多种数据源收集原始数据,才能进行后续的存储、清洗、挖掘等操作;数据存储是采集后的数据存放环节,数据清洗是对采集后数据的预处理,数据挖掘是对处理后数据的分析,均在采集之后。

2、在大数据处理中,以下哪种场景更适合采用流处理技术进行实时数据处理?

A.历史销售数据的离线分析与报表生成

B.电商平台实时订单交易监控与异常预警

C.十年前用户消费行为的大数据挖掘与趋势分析

D.企业年度财务报表的批量统计与汇总

【答案】:B

解析:本题考察批处理与流处理的应用场景差异。流处理技术适用于实时、低延迟的数据处理需求,选项B中‘电商实时订单监控与预警’需要毫秒级或秒级响应,符合流处理特点;而选项A、C、D均为离线数据处理(批处理),适合非实时、大规模历史数据的分析。因此正确答案为B。

3、以下哪项是Hadoop分布式计算框架的核心组件?

A.MapReduce

B.Hive

C.HBase

D.Spark

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。MapReduce是Hadoop分布式计算框架的核心组件,负责分布式并行计算任务;Hive是基于Hadoop的数据仓库工具,HBase是分布式NoSQL数据库,Spark是独立的内存计算引擎,均不属于Hadoop分布式计算框架的核心组件。因此正确答案为A。

4、Hadoop生态系统中,负责分布式文件存储的核心组件是?

A.HDFS(HadoopDistributedFileSystem)

B.MapReduce(分布式计算模型)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态系统的核心组件功能。HDFS(选项A)是Hadoop分布式文件系统,专门用于存储海量分布式数据,是Hadoop的基础存储层;MapReduce(选项B)是分布式计算框架,负责并行处理大数据;YARN(选项C)是资源管理器,负责集群资源调度;Hive(选项D)是基于Hadoop的数据仓库工具,用于数据查询和分析。因此正确答案为A。

5、关于ApacheSpark的描述,以下哪项是正确的?

A.Spark是基于内存计算的开源框架,处理速度远快于MapReduce

B.Spark仅支持批处理,不支持流处理

C.Spark只能处理结构化数据,无法处理半结构化数据

D.Spark需要依赖大量磁盘存储来提高计算效率

【答案】:A

解析:本题考察大数据处理框架知识点。Spark是基于内存计算的开源框架,相比MapReduce(基于磁盘)速度更快,A正确;Spark支持批处理、流处理(如SparkStreaming),可处理结构化和半结构化数据(如JSON、CSV),且内存计算减少磁盘I/O,无需大量磁盘存储。因此正确答案为A。

6、大数据的哪个特征是指数据产生和处理的速度快?

A.速度(Velocity)

B.容量(Volume)

C.多样性(Variety)

D.价值(Value)

【答案】:A

解析:本题考察大数据的4V特征知识点。大数据的Velocity特征特指数据产生和处理的速度快(如实时流数据处理场景);Volume指数据量巨大(PB级以上),Variety指数据类型多样(结构化、半结构化、非结构化),Value指从海量数据中挖掘潜在价值。因此正确答案为A。

7、以下哪项不属于大数据的基本特征?

A.Volume(数据规模)

B.Velocity(处理速度)

C.Variety(数据多样性)

D.Variability(变异性)

【答案】:D

解析:本题考察大数据的4V特征知识点。大数据的基本特征通常指4V:Volume(数据规模巨大)、Velocity(数据产生和处理速度快)、Variety(数据类型多样,含结构化/非结构化数据)、Value(价值密度低但潜在价值高)。“Variability”(变异性)并非大数据的核心特征,因此错误选项为D。

8、以下哪项不属于大数据在商业领域的典型应用?

A.基于用户行为数据的精准营销

B.通过用户画像实现个性化推荐

C.利用历史销售数据进行市场趋势预测

D.传统纸质文档的人工分类与存储管理

【答案】:

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档