2026年国开电大大数据技术形考题库100道及参考答案(完整版).docxVIP

  • 0
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及参考答案(完整版).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪种数据库不属于大数据存储的典型技术?

A.HBase

B.MongoDB

C.MySQL

D.HDFS

【答案】:C

解析:本题考察大数据存储技术知识点。HBase(选项A)是基于HDFS的分布式NoSQL数据库,MongoDB(选项B)是文档型NoSQL数据库,均为大数据常用存储工具;HDFS(选项D)是Hadoop生态的分布式文件系统,用于存储海量数据。而MySQL(选项C)是传统关系型数据库,通常用于结构化数据的中小规模存储,不属于大数据典型存储技术。正确答案为C。

2、Hadoop生态系统中,负责分布式存储的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态组件功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责海量数据的分布式存储;MapReduce是分布式计算框架,YARN负责集群资源管理,Hive提供数据仓库查询接口。因此正确答案为A。

3、在Hadoop生态系统中,负责分布式计算任务调度与资源管理的核心组件是?

A.HDFS(分布式文件系统)

B.YARN(资源管理器)

C.MapReduce(分布式计算框架)

D.Hive(数据仓库工具)

【答案】:B

解析:本题考察Hadoop生态系统核心组件功能。HDFS(A选项)是负责分布式文件存储的组件;YARN(B选项)是Hadoop2.x引入的资源管理器,主要负责集群资源的分配与任务调度;MapReduce(C选项)是基于YARN的分布式计算框架;Hive(D选项)是基于Hadoop的SQL查询工具。因此负责资源管理和调度的是YARN。

4、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.MapReduce(计算框架)

B.HDFS(分布式文件系统)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:B

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专为存储海量数据设计,将数据分散存储在多台服务器上,实现高容错和高吞吐量。MapReduce是分布式计算框架,YARN负责集群资源管理,Hive是基于Hadoop的数据仓库工具,均不负责数据存储。

5、大数据的哪个特征强调数据产生和处理的速度快,例如实时性数据处理?

A.Volume(数据规模大)

B.Velocity(数据处理速度快)

C.Variety(数据类型多样)

D.Value(数据价值密度低)

【答案】:B

解析:本题考察大数据的5V特征知识点。选项A的Volume指数据规模庞大,不符合速度快的描述;选项C的Variety指数据类型多样(结构化、半结构化、非结构化),与速度无关;选项D的Value强调数据价值密度低,需通过挖掘提取价值,也不涉及速度;选项B的Velocity明确指数据产生和处理的速度快,符合题干中“实时性数据处理”的描述,因此正确答案为B。

6、以下哪种算法属于大数据分析中的监督学习?

A.K-Means

B.线性回归

C.PCA

D.Apriori

【答案】:B

解析:本题考察大数据分析中的监督学习知识点。监督学习需要有标签的训练数据,线性回归通过已知特征与标签的映射关系进行预测,属于监督学习;K-Means是无监督聚类算法,PCA是无监督降维算法,Apriori是无监督关联规则挖掘算法。因此正确答案为B。

7、以下哪种算法属于无监督学习算法?

A.K-Means聚类算法

B.线性回归算法

C.逻辑回归算法

D.支持向量机(SVM)分类算法

【答案】:A

解析:本题考察无监督学习算法特征。无监督学习无需标签数据,通过数据自身模式发现规律。K-Means是典型的无监督聚类算法,通过距离度量将数据分组;B、C、D均为有监督学习算法(需标签数据训练,如线性回归用于预测连续值、逻辑回归用于分类、SVM用于分类)。因此正确答案为A。

8、下列算法中,常用于大数据分类任务的是?

A.K-Means聚类算法

B.Apriori关联规则算法

C.支持向量机(SVM)

D.PCA主成分分析算法

【答案】:C

解析:本题考察数据挖掘算法类型知识点。支持向量机(SVM)是典型的有监督分类算法;K-Means是无监督聚类算法,Apriori用于关联规则挖掘(无监督),PCA用于降维(特征工程),因此答案为C。

9、以

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档