2026年国开电大大数据技术形考题库100道含完整答案【名校卷】.docxVIP

  • 0
  • 0
  • 约2.48万字
  • 约 39页
  • 2026-03-09 发布于山东
  • 举报

2026年国开电大大数据技术形考题库100道含完整答案【名校卷】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、Spark作为大数据处理框架,相比HadoopMapReduce的核心优势是?

A.基于内存计算,处理速度更快

B.仅支持结构化数据处理

C.只能进行离线批处理

D.必须运行在分布式文件系统HDFS上

【答案】:A

解析:本题考察Spark与HadoopMapReduce的技术差异。Spark的核心优势是基于内存计算,避免了HadoopMapReduce的磁盘IO瓶颈,因此处理速度更快(尤其适合迭代计算和实时分析)。B选项错误,Spark支持结构化、半结构化(如JSON)、非结构化(如文本)等多种数据类型;C选项错误,Spark不仅支持批处理,还支持SparkStreaming实时计算;D选项错误,Spark可运行在本地、YARN、Kubernetes等多种环境,不依赖HDFS。

2、大数据的哪个特征是指数据的产生和处理速度快?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Value(价值)

【答案】:B

解析:本题考察大数据的核心特征知识点。大数据的四个关键特征中,Velocity(速度)特指数据的产生和处理速度快,能够实时或准实时处理数据;Volume(容量)指数据规模庞大;Variety(多样性)指数据类型多样(结构化、半结构化、非结构化);Value(价值)指数据蕴含的潜在价值。因此正确答案为B。

3、Hadoop分布式文件系统(HDFS)的英文缩写是?

A.HDFS

B.HBase

C.MapReduce

D.YARN

【答案】:A

解析:本题考察Hadoop生态系统的核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop分布式文件系统的缩写,用于存储海量数据;HBase是基于Hadoop的NoSQL数据库,MapReduce是分布式计算框架,YARN是Hadoop的资源管理器,均不属于分布式文件系统。因此正确答案为A。

4、以下哪项不属于大数据的5V特征?

A.Volume(容量)

B.Velocity(速度)

C.Value(价值)

D.Variable(变量)

【答案】:D

解析:大数据5V特征包括Volume(数据量大)、Velocity(处理速度快)、Variety(数据类型多样)、Veracity(数据真实性)、Value(数据价值密度低)。Variable(变量)不属于5V特征,因此答案为D。

5、以下哪种算法属于无监督学习?

A.线性回归(有监督,预测连续值)

B.K-Means(无监督,聚类算法)

C.逻辑回归(有监督,分类算法)

D.决策树(有监督,分类/回归算法)

【答案】:B

解析:本题考察机器学习算法类型。无监督学习无需标签数据,K-Means通过数据特征自动分组(聚类);A、C、D均为有监督学习(需训练标签数据),线性回归用于预测连续值,逻辑回归和决策树用于分类任务,因此B选项正确。

6、Hadoop生态系统中负责分布式存储的核心组件是?

A.MapReduce

B.YARN

C.HDFS

D.Hive

【答案】:C

解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专门负责海量数据的分布式存储;MapReduce是分布式计算框架,用于并行处理大数据;YARN是资源管理器,负责集群资源调度;Hive是基于Hadoop的数据仓库工具,用于数据仓库建模和查询。因此正确答案为C。

7、大数据的4V特征中,不包含以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Veracity(真实性)

D.Variety(多样性)

【答案】:C

解析:本题考察大数据核心特征知识点。大数据的4V特征明确为Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值),而Veracity(真实性)不属于4V特征范畴,属于干扰项。其他选项均为4V特征的组成部分。

8、大数据的4V特征中,不包含以下哪一项?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:D

解析:本题考察大数据4V特征知识点,大数据经典4V特征为Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值),而Veracity(真实性)属于大数据扩展特征(5V中的第五个V),因此4V特征中不包含D选项,正确答案为D。

9、关于大数据

文档评论(0)

1亿VIP精品文档

相关文档