2026年国开电大大数据技术概论形考题库100道含答案【研优卷】.docxVIP

  • 0
  • 0
  • 约2.48万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道含答案【研优卷】.docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、数据清洗的主要目的是?

A.提高数据质量

B.增加数据存储容量

C.改变数据格式

D.预测数据未来趋势

【答案】:A

解析:本题考察大数据预处理中数据清洗的知识点。数据清洗是对原始数据进行去重、填补缺失值、处理异常值等操作,核心目的是去除噪声和错误数据,提高数据质量以支持后续分析。选项B“增加存储容量”是数据扩容的目标,与清洗无关;选项C“改变格式”属于数据转换,非清洗目的;选项D“预测趋势”是数据分析阶段的任务,非清洗阶段。

2、以下哪项是数据仓库的典型特点?

A.面向特定部门需求

B.存储历史与当前数据

C.专注单一业务场景

D.实时响应事务性查询

【答案】:B

解析:本题考察数据仓库与数据集市的区别。数据仓库特点包括面向主题、集成性、非易失性(历史数据)、时变性(存储时间序列数据);A(面向特定部门)是数据集市特点,C(单一业务场景)错误,数据仓库需整合多业务数据,D(实时事务查询)是OLTP系统特点,数据仓库侧重分析而非实时事务。因此正确答案为B。

3、关于大数据的基本特点,以下描述正确的是?

A.大数据仅包含结构化数据(包含非结构化数据)

B.大数据的数据量必须超过100TB(无固定阈值)

C.大数据处理需满足低延迟要求(批处理框架延迟高)

D.大数据具有“4V”特征中的Velocity(处理速度)

【答案】:D

解析:本题考察大数据的核心特点。A错误,大数据包含结构化、半结构化、非结构化数据;B错误,大数据无固定数据量阈值,仅强调规模远超传统工具处理能力;C错误,批处理框架(如MapReduce)对实时性要求低,大数据的Velocity特征强调“处理速度”但不绝对要求低延迟;D正确,大数据“4V”特征包含Velocity(处理速度),因此正确答案为D。

4、以下哪个工具是专门用于大数据交互式可视化分析的?

A.Tableau

B.MySQL

C.Hive

D.Pig

【答案】:A

解析:本题考察大数据可视化工具,Tableau是专业的交互式数据可视化分析工具;MySQL是关系型数据库管理系统,Hive是基于Hadoop的数据仓库工具,Pig是Hadoop的高级查询语言工具,均非可视化工具。

5、大数据的哪个特征强调数据产生和处理的速度要求?

A.Volume(数量)

B.Velocity(速度)

C.Variety(多样性)

D.Veracity(真实性)

【答案】:B

解析:本题考察大数据的5V特征知识点。大数据的5V特征中,Velocity(速度)特指数据产生和处理的速度要求,即数据需要在短时间内被采集、处理和分析以满足实时需求。A选项Volume指数据规模(数量),C选项Variety指数据类型的多样性(结构化、半结构化、非结构化),D选项Veracity指数据的准确性和可信度。因此正确答案为B。

6、大数据技术的发展离不开云计算的支持,以下哪项是云计算为大数据提供的关键支撑?

A.高并发的弹性计算资源(云计算通过资源池化和动态调度,提供高并发、可扩展的计算能力)

B.单一的本地存储设备(云计算采用分布式存储,非单一设备,且大数据需海量存储)

C.固定不变的资源分配策略(云计算支持按需弹性分配资源,非固定)

D.仅提供软件即服务(SaaS)的应用模式(大数据处理更依赖IaaS/PaaS层的基础设施和平台服务)

【答案】:A

解析:本题考察大数据与云计算的关系知识点。云计算通过IaaS/PaaS等模式为大数据提供高并发、可弹性扩展的计算资源和分布式存储资源,是大数据处理的重要支撑。选项B错误(非单一存储),选项C错误(非固定分配),选项D错误(非仅SaaS),因此正确答案为A。

7、以下哪项不属于NoSQL数据库的特点?

A.通常不严格遵循ACID特性

B.支持分布式架构和高扩展性

C.适合存储非结构化或半结构化数据

D.完全兼容SQL语法

【答案】:D

解析:本题考察NoSQL数据库的核心特点知识点。NoSQL数据库(非关系型数据库)的特点包括:支持分布式存储和高扩展性(B正确),适合存储非结构化/半结构化数据(如文档、图片等,C正确),通常采用BASE特性(不严格遵循ACID,A正确)。而SQL语法是关系型数据库的标准语法,NoSQL数据库一般不兼容SQL,因此D选项错误。

8、以下哪项是数据挖掘的主要目标?

A.直接存储原始数据(数据存储属于数据管理环节,非挖掘目标)

B.发现数据中的模式和规律(数据挖掘通过算法从数据中提取隐含、未知的有价值信息,即模式和规律)

C.对数据进行简单的统计描述(统计描述属于描述性分析,非数据挖掘核心目标)

D.压

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档