2026年国开电大大数据技术形考题库100道及答案【名师系列】.docxVIP

  • 0
  • 0
  • 约2.44万字
  • 约 38页
  • 2026-03-09 发布于四川
  • 举报

2026年国开电大大数据技术形考题库100道及答案【名师系列】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、大数据的特征中,体现数据产生和处理速度快的是以下哪一项?

A.Volume(数据量大)

B.Velocity(速度快)

C.Variety(数据多样性)

D.Veracity(数据真实性)

【答案】:B

解析:本题考察大数据的5V特征知识点。Volume指数据规模大,Velocity强调数据产生和处理的速度快,Variety表示数据类型多样(结构化、半结构化、非结构化),Veracity关注数据的准确性和可靠性。因此正确答案为B。

2、大数据的特征中,强调数据产生和处理速度快的是以下哪一项?

A.Volume(规模)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的5V特征中,Velocity(速度)指数据生成和处理的速度快,能够实时或近实时处理数据;A选项Volume是指数据规模大,通常以TB、PB衡量;C选项Variety是指数据类型多样,包括结构化、半结构化和非结构化数据;D选项Veracity是指数据的真实性和准确性,确保数据质量。因此正确答案为B。

3、以下哪一项属于无监督学习算法?

A.决策树

B.K-means

C.线性回归

D.支持向量机(SVM)

【答案】:B

解析:机器学习算法分为监督学习(需标签数据,如分类、回归)和无监督学习(无标签数据,如聚类、降维)。决策树(A)、线性回归(C)、SVM(D)均属于监督学习算法(分别用于分类、回归、分类/回归)。K-means(B)是典型无监督聚类算法,无需标签即可分组数据,因此正确答案为B。

4、以下哪个大数据框架主要用于批处理计算?

A.SparkStreaming(实时流处理框架)

B.Storm(实时流处理框架)

C.Flink(实时流处理框架)

D.MapReduce(分布式批处理框架)

【答案】:D

解析:MapReduce是Hadoop的核心批处理计算框架,适用于离线大数据计算;SparkStreaming、Storm、Flink均支持实时流数据处理(SparkStreaming为微批处理,Storm/Flink为纯流处理)。因此正确答案为D。

5、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.HDFS(Hadoop分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:A

解析:本题考察Hadoop生态系统组件知识点。HDFS是Hadoop的分布式文件系统,专门负责海量数据的分布式存储;MapReduce是批处理计算框架,YARN负责集群资源管理与调度,Hive是数据仓库工具用于数据查询与分析,均不负责核心存储。

6、关于数据仓库与数据湖的区别,以下描述正确的是?

A.数据仓库仅存储结构化数据,数据湖支持多类型原始数据

B.数据仓库支持实时分析,数据湖仅支持离线分析

C.数据仓库的数据更新速度快,数据湖的数据存储格式单一

D.数据仓库适合非结构化数据,数据湖适合结构化数据

【答案】:A

解析:本题考察数据仓库与数据湖的核心差异。数据仓库是面向分析的结构化数据存储,而数据湖是存储原始数据(结构化、半结构化、非结构化)的集中平台,支持多种数据类型(如文本、图像、日志)。B选项错误,数据湖通过Flink等工具可支持实时分析;C选项错误,数据湖的数据更新速度通常更快(原始数据实时写入),且支持多种存储格式;D选项错误,数据仓库适合结构化数据,数据湖适合原始多类型数据。因此A选项描述准确。

7、下列哪项是大数据在交通领域的典型应用?

A.基于用户行为的电商智能推荐

B.城市实时交通流量预测与智能调度

C.医疗影像的自动诊断系统

D.社交媒体情感分析平台

【答案】:B

解析:本题考察大数据应用领域知识点。A项属于电商领域的个性化推荐,C项属于医疗领域的影像分析,D项属于社交领域的舆情监测,均非交通领域应用;B项通过实时分析交通数据(如车流量、车速)实现智能调度与预测,是大数据在交通领域的典型应用。

8、通过分析历史数据揭示未来趋势并预测事件可能性的大数据分析类型是?

A.描述性分析

B.诊断性分析

C.预测性分析

D.规范性分析

【答案】:C

解析:本题考察大数据分析类型知识点。预测性分析的核心是基于历史数据构建模型,预测未来趋势或事件发生概率;描述性分析是总结历史数据(如报表统计),诊断性分析是定位问题原因(如根因分析),规范性分析是提供行动建议(如最优策略推荐)。因此正确答案为C。

9、Hadoop生态系统

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档