2026年国开电大大数据技术形考题库100道附参考答案【夺分金卷】.docxVIP

  • 0
  • 0
  • 约2.56万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道附参考答案【夺分金卷】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、以下哪种算法属于聚类算法?

A.Apriori(关联规则挖掘)

B.K-Means(无监督聚类)

C.SVM(支持向量机)

D.LinearRegression(线性回归)

【答案】:B

解析:K-Means是典型的无监督学习聚类算法,用于将数据自动分组为不同簇。Apriori用于关联规则挖掘,SVM是分类算法,LinearRegression是预测算法,均不属于聚类算法,因此正确答案为B。

2、大数据的4V特征中,不包括以下哪一项?

A.多样性(Variety)

B.可变性(Variability)

C.速度(Velocity)

D.价值(Value)

【答案】:B

解析:本题考察大数据的4V核心特征知识点。大数据的4V特征包括Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)。选项B的“可变性”并非大数据4V特征之一,属于干扰项,因此正确答案为B。

3、以下关于NoSQL数据库的描述,正确的是?

A.NoSQL数据库只能存储结构化数据

B.NoSQL数据库通常不严格遵循ACID事务特性

C.NoSQL数据库仅支持单机部署,无法分布式扩展

D.NoSQL数据库的查询语言与SQL完全相同

【答案】:B

解析:本题考察NoSQL数据库特性知识点。NoSQL(非关系型数据库)的特点:A错误,NoSQL支持非结构化(如文档、图片)、半结构化数据,而SQL主要处理结构化数据;B正确,NoSQL为提高扩展性,通常弱化ACID(如BASE理论),不严格遵循原子性、一致性等特性;C错误,NoSQL支持分布式部署(如MongoDB分片),可横向扩展;D错误,NoSQL查询语言多样(如MongoDB的BSON查询、Redis的键值对查询),与SQL语法不同。因此选B。

4、Hadoop生态系统中负责分布式存储的核心组件是?

A.MapReduce

B.YARN

C.HDFS

D.Hive

【答案】:C

解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专门负责海量数据的分布式存储;MapReduce是分布式计算框架,用于并行处理大数据;YARN是资源管理器,负责集群资源调度;Hive是基于Hadoop的数据仓库工具,用于数据仓库建模和查询。因此正确答案为C。

5、关于数据仓库与数据湖的区别,以下说法正确的是?

A.数据仓库仅存储结构化数据,数据湖可存储多种类型数据

B.数据仓库存储实时数据,数据湖仅存储历史数据

C.数据仓库适合实时分析,数据湖适合离线批处理分析

D.数据仓库和数据湖本质上没有区别,仅为名称差异

【答案】:A

解析:本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据,面向分析场景,经过清洗和整合;数据湖则是原始数据集合,支持存储结构化、半结构化和非结构化数据,保留原始数据形态。B选项错误,两者均可存储实时和历史数据;C选项错误,两者均支持实时或批处理分析;D选项错误,两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。

6、HDFS默认情况下,为每个数据块存储的副本数量是?

A.1

B.2

C.3

D.4

【答案】:C

解析:本题考察HDFS副本机制知识点。HDFS为保障数据可靠性和容错性,默认将每个数据块存储3个副本在不同节点,即使单个节点故障,数据仍可通过其他副本恢复;1个副本无容错能力,2个副本容错性较低,4个副本超出常规默认配置。因此正确答案为C。

7、通过历史数据预测未来趋势的分析属于大数据分析的哪种类型?

A.描述性分析

B.预测性分析

C.规范性分析

D.探索性分析

【答案】:B

解析:本题考察大数据分析类型知识点,预测性分析通过历史数据建模预测未来趋势;描述性分析主要总结历史数据(如报表、统计);规范性分析通过优化算法给出最优决策建议;探索性分析用于发现数据中的潜在模式或关系。因此正确答案为B。

8、Hadoop分布式文件系统HDFS的主要特点不包括以下哪项?

A.采用分块(Block)方式存储超大规模文件

B.支持高容错性,单节点故障不影响整体服务

C.适合存储和处理TB/PB级别的大文件

D.支持实时性要求高的低延迟数据写入操作

【答案】:D

解析:本题考察Hadoop分布式文件系统(HDFS)的核心特点。HDFS的设计目标是存储和处理超大规模数据,其特点包括:采用分块(默认64MB/128MB)存储大文件(选项A、C正确);通过副本机制实现高容错性(选项B正确)。而HDFS采用“一次写入

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档