2026年国开电大大数据技术形考题库100道附答案【满分必刷】.docxVIP

  • 1
  • 0
  • 约2.46万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道附答案【满分必刷】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪个工具是基于Hadoop的开源数据仓库工具,用于结构化数据的查询和分析?

A.HBase

B.Hive

C.Pig

D.Flume

【答案】:B

解析:本题考察大数据生态系统工具的功能。HBase是分布式列存储数据库,用于海量结构化数据的随机读写;Hive是基于Hadoop的开源数据仓库工具,使用类SQL的HQL语言对结构化数据进行查询和分析;Pig是数据流语言和执行框架,用于复杂数据转换;Flume是高可用的日志采集系统。因此正确答案为B。

2、在MapReduce编程模型中,哪个阶段负责对Map阶段输出的中间结果进行聚合,生成最终计算结果?

A.Map阶段

B.Reduce阶段

C.Shuffle阶段

D.Split阶段

【答案】:B

解析:本题考察MapReduce编程模型知识点。MapReduce采用“分而治之”思想,分为Map、Shuffle、Reduce三个主要阶段。Map阶段(A)负责将输入数据拆分为键值对,进行初步映射处理;Shuffle阶段(C)负责将Map输出的中间结果按Key分发到对应的Reduce节点;Reduce阶段(B)接收Shuffle后的中间结果,对相同Key的Value进行聚合计算,生成最终结果。Split阶段(D)是数据分片,属于底层准备工作。因此答案为B。

3、大数据的核心特征通常包括“4V”,以下哪一项不属于大数据的“4V”特征?

A.Volume(容量)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:D

解析:本题考察大数据的4V特征知识点。大数据的“4V”特征是指Volume(数据规模)、Velocity(数据产生与处理速度)、Variety(数据类型多样性)、Value(价值密度低),而Veracity(真实性)属于数据质量维度,并非“4V”核心特征,因此错误选项D描述错误。

4、Hadoop分布式文件系统(HDFS)的核心作用是?

A.提供分布式计算框架

B.实现海量数据的分布式存储

C.执行数据挖掘算法

D.进行数据可视化展示

【答案】:B

解析:本题考察Hadoop生态系统组件。HDFS是Hadoop的分布式存储系统,主要负责将海量数据分散存储在多台服务器上;A选项是MapReduce/YARN的功能;C选项数据挖掘工具如Mahout不属于HDFS;D选项数据可视化工具如Hue属于辅助组件,非HDFS核心功能。因此正确答案为B。

5、大数据处理中,构建分布式计算集群最常用的云计算服务模式是?

A.IaaS(基础设施即服务)

B.PaaS(平台即服务)

C.SaaS(软件即服务)

D.混合云(混合部署模式)

【答案】:A

解析:本题考察大数据与云计算服务模式的关系知识点。IaaS(A选项)提供服务器、存储、网络等基础设施资源,适合部署Hadoop等分布式计算集群;PaaS(B选项)提供开发运行平台,适合快速开发应用但灵活性不足;SaaS(C选项)是直接提供软件应用,无法满足大数据底层硬件需求;混合云(D选项)是云服务部署模式,非服务类型。因此正确答案为A。

6、在Hadoop生态系统中,负责分布式存储的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责大数据的分布式存储;MapReduce是分布式计算框架,YARN是资源管理器,Hive是基于Hadoop的数据仓库工具。因此负责分布式存储的是HDFS,正确答案为A。

7、在数据仓库设计中,以下哪种模型是由一个事实表和多个直接关联的维度表组成,且维度表之间通常无冗余?

A.星型模型(StarSchema)

B.雪花模型(SnowflakeSchema)

C.星座模型(GalaxySchema)

D.层次模型(HierarchicalModel)

【答案】:A

解析:本题考察数据仓库模型知识点。星型模型的结构为:一个事实表(存储业务指标)和多个维度表(存储维度属性),维度表直接关联事实表,无冗余;雪花模型维度表会进一步分解为子维度表,存在冗余;星座模型包含多个事实表共享维度表;层次模型是传统数据库的树形结构,与数据仓库模型无关。因此正确答案为星型模型。

8、大数据的5V特征中,不包括以下哪一项?

A.Volume

B.Velocity

C.Viscosity

D.Variety

【答案】:C

解析:本题考察大

文档评论(0)

1亿VIP精品文档

相关文档