2026年国开电大大数据技术概论形考题库100道【历年真题】.docxVIP

  • 0
  • 0
  • 约2.48万字
  • 约 39页
  • 2026-03-09 发布于山东
  • 举报

2026年国开电大大数据技术概论形考题库100道【历年真题】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、Hadoop分布式文件系统(HDFS)的核心作用是?

A.执行分布式并行计算任务

B.存储海量结构化与非结构化数据

C.提供集群资源调度与管理

D.实时处理高吞吐量流数据

【答案】:B

解析:本题考察Hadoop生态系统核心组件的功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式存储系统,核心作用是存储海量数据(包括结构化、半结构化和非结构化数据)。选项A对应MapReduce(分布式计算框架),选项C对应YARN(资源管理器),选项D对应Storm/SparkStreaming(流处理框架),均非HDFS的功能。

2、以下关于数据仓库的描述,正确的是?

A.数据仓库仅用于存储实时产生的业务数据

B.数据仓库的数据通常支持联机事务处理(OLTP)

C.数据仓库是面向主题的、集成的、非易失的数据集

D.数据仓库的数据仅包含结构化数据,不包含非结构化数据

【答案】:C

解析:本题考察数据仓库定义知识点。数据仓库是面向主题(针对特定业务需求)、集成(整合多源数据)、非易失(数据一般不频繁修改)、时变(随时间演化)的数据集,用于支持管理决策,因此C正确。A错误,数据仓库数据多为批处理生成,非实时;B错误,数据仓库主要支持OLAP(联机分析处理),而非OLTP(事务处理);D错误,数据仓库可包含结构化、半结构化、非结构化数据。

3、在大数据存储技术中,MongoDB主要适用于存储以下哪种类型的数据?

A.高度结构化的企业财务数据

B.关系复杂的多表关联业务数据

C.非结构化/半结构化数据(如用户评论)

D.需事务一致性的金融交易数据

【答案】:C

解析:本题考察NoSQL数据库的应用场景。MongoDB是典型的文档型NoSQL数据库,适用于存储非结构化或半结构化数据(如JSON格式的用户评论、图片元数据等),具有灵活的模式设计和高扩展性。A、B、D均属于关系型数据库(如MySQL、Oracle)的典型应用场景,强调结构化和事务一致性。因此正确答案为C。

4、在大数据技术中,用于高效收集和传输大量日志数据的开源工具是?

A.Flume

B.Sqoop

C.Kafka

D.Hive

【答案】:A

解析:本题考察大数据数据采集工具的功能。Flume是Cloudera开源的日志收集系统,可高效处理海量日志数据;B选项Sqoop用于关系型数据库与Hadoop间的数据传输;C选项Kafka是分布式消息队列,用于高吞吐量消息发布与订阅;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询与分析,因此正确答案为A。

5、以下哪项是大数据的典型特征?

A.数据量小

B.处理速度慢

C.数据类型单一

D.数据价值密度低

【答案】:D

解析:大数据的5V特征包括Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(真实)、Value(价值密度低)。A选项数据量小是传统小数据的特点,大数据数据量巨大;B选项处理速度慢不符合大数据‘高速’处理需求;C选项数据类型单一错误,大数据包含结构化、半结构化、非结构化数据(如文本、图像等),类型多样。因此正确答案为D。

6、在Hadoop生态系统中,负责存储海量分布式数据的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专为存储海量数据设计,支持大文件和高容错性;MapReduce是分布式计算框架,负责并行处理数据;YARN负责集群资源管理和任务调度;Hive是基于Hadoop的数据仓库工具,用于SQL类查询。因此正确答案为A。

7、以下哪项不属于大数据的5V特征?

A.容量(Volume)

B.速度(Velocity)

C.多样性(Variety)

D.复杂性(Complexity)

【答案】:D

解析:本题考察大数据5V特征知识点。大数据的5V特征包括容量(Volume)、速度(Velocity)、多样性(Variety)、真实性(Veracity)和价值(Value),选项A、B、C均属于5V特征,而D选项“复杂性”并非5V特征之一,因此正确答案为D。

8、在大数据处理流程中,对数据进行缺失值填充、异常值处理的操作属于以下哪个环节?

A.数据清洗

B.数据集成

C.数据转换

D.数据挖掘

【答案】:A

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档