2026年国开电大大数据技术概论形考题库100道附参考答案(完整版).docxVIP

  • 0
  • 0
  • 约2.41万字
  • 约 38页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道附参考答案(完整版).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、大数据的“4V”特征中,指数据产生和处理的速度快的是哪个特征?

A.Volume(数据规模)

B.Velocity(数据速度)

C.Variety(数据多样性)

D.Value(数据价值密度)

【答案】:B

解析:本题考察大数据的核心特征知识点。大数据“4V”特征中,Velocity(速度)特指数据产生和处理的速度快,如实时数据流的处理需求;A选项Volume是指数据规模巨大;C选项Variety是指数据类型多样(结构化、半结构化、非结构化);D选项Value是指数据价值密度低(海量数据中有效信息占比小)。因此正确答案为B。

2、数据预处理中,用于处理数据缺失值和异常值的步骤是?

A.数据集成

B.数据清洗

C.数据变换

D.数据规约

【答案】:B

解析:本题考察数据预处理的核心步骤。数据清洗(B)主要处理数据质量问题,包括缺失值填充、异常值修正、重复值删除等;数据集成(A)是合并多源数据;数据变换(C)是对数据格式或数值范围调整(如标准化);数据规约(D)是减少数据规模(如降维)。因此处理缺失值和异常值属于数据清洗,正确答案为B。

3、以下哪项不属于大数据的4V特征?

A.Velocity

B.Variety

C.Veracity

D.Volume

【答案】:C

解析:本题考察大数据的核心特征知识点。大数据的4V特征通常指Volume(数据量)、Velocity(数据产生速度)、Variety(数据多样性)和Value(数据价值),而Veracity(数据真实性)虽在数据质量维度有一定意义,但并非4V特征的标准组成部分,因此选项C不属于大数据的4V特征。

4、以下哪项是数据挖掘的主要目标?

A.实现数据的高效存储

B.从数据中发现隐含的模式和规律

C.对数据进行可视化展示

D.完成数据的备份与恢复

【答案】:B

解析:本题考察数据挖掘的概念。数据挖掘是从大量数据中提取隐含、未知、有价值的信息(如关联规则、分类模型、聚类结构等),其核心目标是发现数据中的模式和规律。而数据存储、可视化、备份均不属于数据挖掘的范畴,因此正确答案为B。

5、以下哪项不属于NoSQL数据库的特点?

A.通常不严格遵循ACID特性

B.支持分布式架构和高扩展性

C.适合存储非结构化或半结构化数据

D.完全兼容SQL语法

【答案】:D

解析:本题考察NoSQL数据库的核心特点知识点。NoSQL数据库(非关系型数据库)的特点包括:支持分布式存储和高扩展性(B正确),适合存储非结构化/半结构化数据(如文档、图片等,C正确),通常采用BASE特性(不严格遵循ACID,A正确)。而SQL语法是关系型数据库的标准语法,NoSQL数据库一般不兼容SQL,因此D选项错误。

6、Hadoop生态系统中,MapReduce的核心设计思想是?

A.分而治之

B.快速排序

C.哈希表查找

D.动态规划

【答案】:A

解析:本题考察Hadoop生态系统中MapReduce的核心思想。MapReduce是一种分布式计算框架,其核心思想是将复杂任务分解为多个子任务(Map阶段)并行处理,再将结果汇总(Reduce阶段),即“分而治之”。选项B(快速排序)、C(哈希表查找)、D(动态规划)均不属于MapReduce的核心思想,因此正确答案为A。

7、以下哪项属于大数据的可视化分析工具?

A.Hadoop(分布式计算框架)

B.Tableau(专业数据可视化工具)

C.Hive(数据仓库查询工具)

D.Kafka(实时消息队列系统)

【答案】:B

解析:本题考察大数据工具的功能分类。正确答案为B,Tableau是专业交互式数据可视化工具,支持多数据源连接和图表生成。A选项Hadoop是分布式计算框架,不涉及可视化;C选项Hive是数据仓库工具,用于存储和查询数据;D选项Kafka是实时消息队列,用于数据传输和解耦。因此B是唯一的可视化工具。

8、以下哪项是专业的大数据可视化工具?

A.Tableau

B.Python

C.Hive

D.MySQL

【答案】:A

解析:本题考察大数据工具类型知识点。Tableau是专业的交互式数据可视化工具,支持多维度图表生成;B选项Python是通用编程语言,需结合库(如Matplotlib)实现可视化;C选项Hive是基于Hadoop的数据仓库工具,用于数据存储与查询;D选项MySQL是关系型数据库管理系统,非可视化工具。因此正确答案为A。

9、在大数据预处理流程中,以下哪项操作不属于数据清洗的范畴?

A.去除重复记录与异常值

B.填补缺失的用户注册时间数据

C.对敏感数据(如身份

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档