2026年国开电大大数据技术概论形考题库100道附参考答案(能力提升).docxVIP

  • 1
  • 0
  • 约2.47万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道附参考答案(能力提升).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据技术的发展离不开云计算的支持,以下哪项是云计算为大数据提供的关键支撑?

A.高并发的弹性计算资源(云计算通过资源池化和动态调度,提供高并发、可扩展的计算能力)

B.单一的本地存储设备(云计算采用分布式存储,非单一设备,且大数据需海量存储)

C.固定不变的资源分配策略(云计算支持按需弹性分配资源,非固定)

D.仅提供软件即服务(SaaS)的应用模式(大数据处理更依赖IaaS/PaaS层的基础设施和平台服务)

【答案】:A

解析:本题考察大数据与云计算的关系知识点。云计算通过IaaS/PaaS等模式为大数据提供高并发、可弹性扩展的计算资源和分布式存储资源,是大数据处理的重要支撑。选项B错误(非单一存储),选项C错误(非固定分配),选项D错误(非仅SaaS),因此正确答案为A。

2、Hadoop生态系统中,负责分布式存储海量数据的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.ZooKeeper

【答案】:A

解析:本题考察Hadoop核心组件功能。HDFS(HadoopDistributedFileSystem)是分布式文件系统,专门用于存储海量数据;MapReduce是分布式计算框架,负责数据处理;YARN是资源管理器,协调集群资源分配;ZooKeeper是分布式协调服务。因此负责分布式存储的是HDFS,正确答案为A。

3、Hadoop生态系统中,哪个组件负责分布式文件存储?

A.MapReduce

B.HDFS

C.YARN

D.Hive

【答案】:B

解析:本题考察Hadoop生态系统组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,用于在集群中存储海量数据;A选项MapReduce是分布式计算框架,负责并行任务处理;C选项YARN是资源管理器,负责集群资源调度;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此正确答案为B。

4、以下哪种数据库适合存储非结构化数据(如日志、图片、社交网络数据)?

A.MySQL(关系型数据库)

B.MongoDB(NoSQL文档数据库)

C.Oracle(关系型数据库)

D.SQLServer(关系型数据库)

【答案】:B

解析:本题考察数据库类型知识点。关系型数据库(如MySQL、Oracle、SQLServer)采用结构化表结构,适合存储结构化数据(如用户信息、交易记录);NoSQL数据库(如MongoDB)支持非结构化/半结构化数据,MongoDB作为文档型NoSQL数据库,以JSON-like文档存储,能灵活处理日志、图片等非结构化数据。因此正确答案为B。

5、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.Hive

【答案】:A

解析:本题考察Hadoop生态系统组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责将海量数据分散存储在多台服务器上;MapReduce是分布式计算框架,用于并行处理数据;YARN是资源管理器,负责集群资源调度;Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。因此负责分布式存储的是HDFS。

6、以下哪个场景最能体现大数据技术的应用价值?

A.某学校人工统计学生成绩并记录在纸质表格中

B.某电商平台根据用户浏览和购买历史推荐个性化商品

C.某工厂仅依靠人工经验调整生产线参数

D.某图书馆手工整理书籍借阅卡片

【答案】:B

解析:本题考察大数据应用场景知识点。大数据技术通过分析海量用户行为数据(如浏览、购买历史),实现精准推荐。选项A、C、D均为传统人工操作,未体现大数据技术的自动化、智能化分析能力。选项B中电商平台利用用户数据推荐商品,是大数据在精准营销中的典型应用,因此正确答案为B。

7、以下哪个不是Hadoop生态系统的核心组件?

A.HDFS(分布式文件系统)

B.Spark(内存计算框架)

C.YARN(资源管理器)

D.MapReduce(计算框架)

【答案】:B

解析:本题考察Hadoop生态系统核心组件知识点。Hadoop生态系统核心组件包括HDFS(分布式存储)、MapReduce(分布式计算)、YARN(资源管理)等。Spark是独立的大数据处理框架,不属于Hadoop生态系统核心组件,因此正确答案为B。

8、大数据的5V特征中,‘Volume’指的是大数据的什么特性?

A.数据价值

B.处理速度

C.数据容量

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档