2026年国开电大大数据技术形考题库100道加答案.docxVIP

  • 1
  • 0
  • 约2.49万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道加答案.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、某企业将大数据平台部署在独立的数据中心,仅内部使用,不对外开放服务,这种部署模式属于?

A.公有云部署

B.私有云部署

C.混合云部署

D.社区云部署

【答案】:B

解析:本题考察大数据平台部署模式知识点。私有云(B)是企业自建或第三方提供的封闭云平台,仅供内部使用;公有云(A)面向公众开放服务;混合云(C)结合公有云和私有云优势;社区云(D)由特定社区共享使用。因此B选项正确。

2、在大数据数据预处理过程中,对数据进行格式转换(如数值型转字符串型)属于哪个步骤?

A.数据清洗

B.数据集成

C.数据转换

D.数据规约

【答案】:C

解析:本题考察数据预处理步骤知识点。数据转换(DataTransformation)是对数据进行格式调整、标准化、归一化等操作,包括数值型转字符串型;A选项数据清洗主要处理噪声、缺失值;B选项数据集成是合并多源数据;D选项数据规约是降维或减少特征维度,均不符合题意。

3、Hadoop生态系统中,负责分布式存储的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(Hadoop分布式文件系统)是Hadoop的分布式存储核心组件,专为存储海量数据设计;MapReduce是分布式计算框架,负责数据处理逻辑;YARN是资源管理器,协调集群计算资源分配;Hive是基于Hadoop的数据仓库工具,用于数据查询与分析。因此正确答案为A。

4、在大数据分析流程中,数据清洗的主要目的是?

A.将多源数据合并为统一格式

B.处理缺失值、异常值以保证数据质量

C.降低数据维度减少计算量

D.转换数据格式以适配分析工具

【答案】:B

解析:本题考察数据预处理步骤。数据清洗是大数据分析前的关键环节,核心任务是处理数据中的噪声(如缺失值、异常值)和不一致性;A选项对应数据集成;C选项对应数据规约;D选项对应数据转换。因此正确答案为B。

5、在Hadoop生态系统中,负责分布式存储的核心组件是?

A.MapReduce

B.YARN

C.HDFS

D.Hive

【答案】:C

解析:HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,用于存储海量数据;MapReduce是Hadoop的核心计算框架,负责并行计算任务;YARN是资源管理器,负责调度集群资源;Hive是数据仓库工具。因此负责分布式存储的是HDFS,答案为C。

6、以下哪项属于数据挖掘的典型应用场景?

A.对原始数据进行去重清洗

B.通过聚类算法实现客户细分

C.从传感器实时采集数据

D.将数据转换为图表进行展示

【答案】:B

解析:本题考察数据挖掘的定义及应用。数据挖掘是从大量数据中通过算法发现潜在模式或知识的过程。B选项“通过聚类算法实现客户细分”属于数据挖掘(聚类分析)的典型应用,通过对客户特征数据分组,识别不同客户群体。A选项“数据清洗”属于数据预处理环节,C选项“数据采集”是数据获取阶段,D选项“数据可视化”是数据呈现手段,均不属于数据挖掘。因此正确答案为B。

7、大数据的4V特征中,不包括以下哪一项?

A.多样性(Variety)

B.可变性(Variability)

C.速度(Velocity)

D.价值(Value)

【答案】:B

解析:本题考察大数据的4V核心特征知识点。大数据的4V特征包括Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)。选项B的“可变性”并非大数据4V特征之一,属于干扰项,因此正确答案为B。

8、大数据的5V特征中,“Velocity”指的是?

A.数据处理的速度(数据产生和流动的速度)

B.数据的规模(数据量大小)

C.数据的多样性(结构化与非结构化数据并存)

D.数据的价值密度(数据蕴含的价值)

【答案】:A

解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。

9、以下哪项不属于大数据的基本特征?

A.Volume

B.Velocity

C.Value

D.Variability

【答案】:D

解析:大数据的基本特征通常概括为4V:Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、V

文档评论(0)

1亿VIP精品文档

相关文档