2026年国开电大大数据技术形考题库100道附参考答案(巩固).docxVIP

  • 2
  • 0
  • 约2.4万字
  • 约 38页
  • 2026-03-09 发布于山东
  • 举报

2026年国开电大大数据技术形考题库100道附参考答案(巩固).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、MongoDB数据库属于以下哪种类型的NoSQL数据库?

A.关系型数据库

B.文档型数据库

C.键值对数据库

D.列族型数据库

【答案】:B

解析:本题考察NoSQL数据库类型,MongoDB以JSON/BSON格式存储数据,属于文档型数据库;关系型数据库以MySQL为代表,键值对数据库如Redis,列族型数据库如HBase(适用于结构化高维数据)。因此正确答案为B。

2、下列算法中,属于分类算法的是?

A.K-Means(聚类算法)

B.Apriori(关联规则挖掘算法)

C.决策树(分类/回归算法)

D.PCA(主成分分析算法)

【答案】:C

解析:本题考察数据挖掘算法类型知识点。决策树(C选项)是典型的分类算法,可用于预测类别标签;K-Means(A选项)是无监督聚类算法,用于数据分组;Apriori(B选项)是关联规则挖掘算法,用于发现数据项之间的关联关系;PCA(D选项)是降维算法,用于减少特征维度。因此正确答案为C。

3、大数据在医疗领域的典型应用场景是?

A.智能交通信号控制(交通领域)

B.医疗影像辅助诊断(医疗领域)

C.电商个性化推荐(电商领域)

D.社交网络舆情监控(舆情领域)

【答案】:B

解析:本题考察大数据应用场景知识点。医疗影像辅助诊断利用大数据分析医学影像数据,辅助医生提高诊断效率;A属于交通领域的智能信号控制,C属于电商的个性化推荐,D属于舆情监控领域,均非医疗典型应用。因此选B。

4、大数据的经典‘4V’特征不包括以下哪一项?

A.Veracity(真实性)

B.Volume(数据量)

C.Velocity(处理速度)

D.Variety(数据多样性)

【答案】:A

解析:本题考察大数据的‘4V’核心特征知识点。大数据的经典‘4V’特征明确为:Volume(数据量巨大)、Velocity(处理速度快)、Variety(数据类型多样)、Value(低价值密度但蕴含价值)。选项A的‘Veracity’(真实性)属于数据质量维度的概念,并非大数据‘4V’特征的核心组成部分,因此正确答案为A。

5、Hadoop生态系统中,负责分布式文件存储的核心组件是?

A.HDFS

B.MapReduce

C.YARN

D.Spark

【答案】:A

解析:Hadoop生态系统核心组件包括:HDFS(HadoopDistributedFileSystem,分布式文件系统,负责存储)、MapReduce(分布式计算框架)、YARN(资源管理器)。Spark是独立的开源集群计算框架,不属于Hadoop核心组件。因此,负责分布式文件存储的是HDFS,正确答案为A。

6、以下哪种框架主要用于实时流数据处理?

A.MapReduce

B.Spark

C.Flink

D.HBase

【答案】:C

解析:本题考察主流数据处理框架的应用场景。Flink是专门针对实时流数据处理的开源框架,支持高吞吐、低延迟的流处理任务。A选项MapReduce和B选项Spark主要用于批处理(Spark也支持流处理但非核心定位),D选项HBase是分布式NoSQL数据库,用于存储和访问海量结构化数据,因此正确答案为C。

7、在大数据分析流程中,哪个步骤主要用于处理数据中的缺失值和异常值?

A.数据采集

B.数据清洗

C.数据挖掘

D.数据可视化

【答案】:B

解析:数据清洗是大数据分析的关键前置步骤,核心任务是处理原始数据中的噪声、缺失值、异常值、重复数据及格式不一致等问题,确保数据质量;数据采集是获取原始数据的过程,数据挖掘是从数据中提取模式,数据可视化是结果展示环节,故正确答案为B。

8、数据仓库与数据集市的主要区别在于?

A.数据仓库仅存储结构化数据,数据集市可存储非结构化数据

B.数据集市面向特定业务部门需求,数据仓库面向企业整体主题域

C.数据仓库数据粒度更细,数据集市数据粒度更粗

D.数据仓库数据实时性高,数据集市数据实时性低

【答案】:B

解析:数据仓库是面向企业整体主题域的综合性数据集合,数据集市是面向特定部门(如销售、财务)的小型子集,二者核心区别在于应用范围;选项A错误,二者均可存储结构化/非结构化数据;选项C错误,数据集市粒度通常更细;选项D错误,二者实时性取决于技术架构而非类型。因此正确答案为B。

9、大数据的5V特征中,不包括以下哪个?

A.Volume(容量)

B.Velocity(速度)

C.Valueability(价值能力)

D.Variety(多样性)

【答案】:C

解析:本题考察大数据5V特征知识点。大数据5V特征标准定义为Volume

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档