2026年国开电大大数据技术形考题库100道及参考答案（完整版）.docxVIP

下载本文档

0
0
约2.45万字
约 39页
2026-03-09 发布于河南
举报

2026年国开电大大数据技术形考题库100道及参考答案（完整版）.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪种数据库不属于大数据存储的典型技术？

A.HBase

B.MongoDB

C.MySQL

D.HDFS

【答案】：C

解析：本题考察大数据存储技术知识点。HBase（选项A）是基于HDFS的分布式NoSQL数据库，MongoDB（选项B）是文档型NoSQL数据库，均为大数据常用存储工具；HDFS（选项D）是Hadoop生态的分布式文件系统，用于存储海量数据。而MySQL（选项C）是传统关系型数据库，通常用于结构化数据的中小规模存储，不属于大数据典型存储技术。正确答案为C。

2、Hadoop生态系统中，负责分布式存储的核心组件是？

A.HDFS（分布式文件系统）

B.MapReduce（计算框架）

C.YARN（资源管理器）

D.Hive（数据仓库工具）

【答案】：A

解析：本题考察Hadoop生态组件功能。HDFS（HadoopDistributedFileSystem）是Hadoop的分布式文件系统，负责海量数据的分布式存储；MapReduce是分布式计算框架，YARN负责集群资源管理，Hive提供数据仓库查询接口。因此正确答案为A。

3、在Hadoop生态系统中，负责分布式计算任务调度与资源管理的核心组件是？

A.HDFS（分布式文件系统）

B.YARN（资源管理器）

C.MapReduce（分布式计算框架）

D.Hive（数据仓库工具）

【答案】：B

解析：本题考察Hadoop生态系统核心组件功能。HDFS（A选项）是负责分布式文件存储的组件；YARN（B选项）是Hadoop2.x引入的资源管理器，主要负责集群资源的分配与任务调度；MapReduce（C选项）是基于YARN的分布式计算框架；Hive（D选项）是基于Hadoop的SQL查询工具。因此负责资源管理和调度的是YARN。

4、Hadoop生态系统中，负责分布式数据存储的核心组件是？

A.MapReduce（计算框架）

B.HDFS（分布式文件系统）

C.YARN（资源管理器）

D.Hive（数据仓库工具）

【答案】：B

解析：本题考察Hadoop生态系统核心组件知识点。HDFS（HadoopDistributedFileSystem）是Hadoop的分布式文件系统，专为存储海量数据设计，将数据分散存储在多台服务器上，实现高容错和高吞吐量。MapReduce是分布式计算框架，YARN负责集群资源管理，Hive是基于Hadoop的数据仓库工具，均不负责数据存储。

5、大数据的哪个特征强调数据产生和处理的速度快，例如实时性数据处理？

A.Volume（数据规模大）

B.Velocity（数据处理速度快）

C.Variety（数据类型多样）

D.Value（数据价值密度低）

【答案】：B

解析：本题考察大数据的5V特征知识点。选项A的Volume指数据规模庞大，不符合速度快的描述；选项C的Variety指数据类型多样（结构化、半结构化、非结构化），与速度无关；选项D的Value强调数据价值密度低，需通过挖掘提取价值，也不涉及速度；选项B的Velocity明确指数据产生和处理的速度快，符合题干中“实时性数据处理”的描述，因此正确答案为B。

6、以下哪种算法属于大数据分析中的监督学习？

A.K-Means

B.线性回归

C.PCA

D.Apriori

【答案】：B

解析：本题考察大数据分析中的监督学习知识点。监督学习需要有标签的训练数据，线性回归通过已知特征与标签的映射关系进行预测，属于监督学习；K-Means是无监督聚类算法，PCA是无监督降维算法，Apriori是无监督关联规则挖掘算法。因此正确答案为B。

7、以下哪种算法属于无监督学习算法？

A.K-Means聚类算法

B.线性回归算法

C.逻辑回归算法

D.支持向量机（SVM）分类算法

【答案】：A

解析：本题考察无监督学习算法特征。无监督学习无需标签数据，通过数据自身模式发现规律。K-Means是典型的无监督聚类算法，通过距离度量将数据分组；B、C、D均为有监督学习算法（需标签数据训练，如线性回归用于预测连续值、逻辑回归用于分类、SVM用于分类）。因此正确答案为A。

8、下列算法中，常用于大数据分类任务的是？

A.K-Means聚类算法

B.Apriori关联规则算法

C.支持向量机（SVM）

D.PCA主成分分析算法

【答案】：C

解析：本题考察数据挖掘算法类型知识点。支持向量机（SVM）是典型的有监督分类算法；K-Means是无监督聚类算法，Apriori用于关联规则挖掘（无监督），PCA用于降维（特征工程），因此答案为C。

2026年国开电大大数据技术形考题库100道及参考答案（完整版）.docxVIP

2026年国开电大大数据技术形考题库100道及参考答案（完整版）.docx

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档