2026年国开电大大数据技术形考题库100道及完整答案【典优】.docxVIP

  • 1
  • 0
  • 约2.42万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及完整答案【典优】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、大数据的5V特征中,“Velocity”指的是?

A.数据处理的速度(数据产生和流动的速度)

B.数据的规模(数据量大小)

C.数据的多样性(结构化与非结构化数据并存)

D.数据的价值密度(数据蕴含的价值)

【答案】:A

解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。

2、以下哪个是典型的大数据批处理计算框架?

A.MapReduce

B.SparkStreaming

C.ApacheFlink

D.ApacheStorm

【答案】:A

解析:本题考察大数据计算框架类型。MapReduce是Hadoop生态系统中经典的批处理计算框架,适用于离线、大规模数据处理;SparkStreaming、Flink、Storm均以实时流处理为核心设计(可处理批处理但非典型批处理框架)。因此正确答案为A。

3、关于数据仓库(DataWarehouse)和数据集市(DataMart)的描述,正确的是?

A.数据集市是面向企业整体的,数据仓库是面向部门的

B.数据集市的数据来源于数据仓库

C.数据仓库通常存储细节数据,数据集市仅存储汇总数据

D.数据仓库规模较小,数据集市规模较大

【答案】:B

解析:本题考察数据仓库与数据集市的概念区别。数据集市是数据仓库的子集,其数据来源于数据仓库(通常是从数据仓库中抽取特定业务部门所需的数据);A选项混淆了两者的面向范围(数据仓库面向企业整体,数据集市面向部门);C选项错误(数据集市也可存储细节数据);D选项错误(数据仓库规模通常更大)。因此正确答案为B。

4、以下哪种数据库属于非关系型数据库(NoSQL数据库)?

A.MySQL

B.Oracle

C.MongoDB

D.SQLServer

【答案】:C

解析:本题考察关系型与非关系型数据库知识点。关系型数据库(如A选项MySQL、B选项Oracle、D选项SQLServer)基于关系模型,使用表格结构和SQL语言进行操作,具有严格的表结构和关系约束;C选项MongoDB是文档型NoSQL数据库,属于非关系型数据库,以键值对或文档(如JSON格式)存储数据,灵活扩展,适合非结构化数据存储。因此正确答案为C。

5、在大数据处理流程中,“去除重复数据、处理缺失值、修正异常值”属于以下哪个步骤?

A.数据集成

B.数据清洗

C.数据转换

D.数据规约

【答案】:B

解析:本题考察大数据预处理步骤的定义。数据清洗(B选项)的主要目的是处理数据质量问题,包括去除重复记录、填补缺失值、修正异常值等;数据集成(A选项)是合并多源数据;数据转换(C选项)是对数据格式或结构进行标准化处理;数据规约(D选项)是通过降维等方式减少数据规模。因此正确步骤为数据清洗。

6、以下哪个工具是专为大数据分布式计算设计的内存计算框架?

A.ApacheSpark

B.PythonPandas

C.NumPy

D.Scikit-learn

【答案】:A

解析:本题考察大数据分布式计算工具知识点。ApacheSpark是基于内存的分布式计算框架,适用于大规模数据处理;PythonPandas、NumPy主要用于单机数据处理与数值计算,Scikit-learn是机器学习库,因此专为分布式计算设计的是Spark,正确选项A。

7、在决策树算法中,ID3算法用于选择最优分裂特征时采用的指标是?

A.信息增益

B.信息增益比

C.基尼指数

D.均方误差

【答案】:A

解析:本题考察决策树算法的核心指标。决策树分裂特征选择是关键:ID3算法基于信息熵,使用“信息增益”(选项A)衡量特征对分类的贡献;C4.5算法优化为“信息增益比”(选项B)以解决信息增益偏向多值特征的问题;CART算法(分类与回归树)采用“基尼指数”(选项C);均方误差(选项D)是回归问题中(如线性回归)衡量预测误差的指标,与决策树无关。因此ID3算法使用信息增益选择分裂特征。

8、以下关于NoSQL数据库的描述,正确的是?

A.NoSQL数据库只能存储结构化数据

B.NoSQL数据库通常不严格遵循ACID事务特性

C.NoSQL数据库仅支持单机部署,无法分布式扩展

D.NoSQL数据库的查询语言与SQL完全相同

【答案】:B

解析:本题考察NoSQL数据库特性知识点。NoSQL(非关系型数据库)的特点:A错误

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档