2026年国开电大大数据技术形考题库100道及完整答案(必刷).docxVIP

  • 0
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及完整答案(必刷).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、下列哪种工具属于大数据可视化工具?

A.MySQL(关系型数据库管理系统)

B.ApacheHBase(分布式数据库)

C.Tableau(交互式可视化平台)

D.Pig(高级查询语言)

【答案】:C

解析:本题考察大数据工具类型。Tableau是专业的交互式数据可视化工具,用于生成图表、仪表盘等;A、B属于数据存储工具,D是Hadoop生态中的查询语言,因此正确答案为C。

2、在Hadoop生态系统中,负责分布式存储海量数据的核心组件是?

A.HDFS(Hadoop分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.ZooKeeper(分布式协调服务)

【答案】:A

解析:本题考察Hadoop生态系统核心组件知识点。HDFS(Hadoop分布式文件系统)是Hadoop生态的基础,专为分布式存储海量数据设计;MapReduce是分布式计算框架,YARN负责资源管理与调度,ZooKeeper用于分布式协调,因此负责分布式存储的是HDFS,正确选项A。

3、通过分析历史数据揭示未来趋势并预测事件可能性的大数据分析类型是?

A.描述性分析

B.诊断性分析

C.预测性分析

D.规范性分析

【答案】:C

解析:本题考察大数据分析类型知识点。预测性分析的核心是基于历史数据构建模型,预测未来趋势或事件发生概率;描述性分析是总结历史数据(如报表统计),诊断性分析是定位问题原因(如根因分析),规范性分析是提供行动建议(如最优策略推荐)。因此正确答案为C。

4、以下哪项是大数据在‘精准营销’场景下的典型应用?

A.电商平台根据用户历史购物行为推荐商品

B.医院利用大数据分析医疗影像诊断疾病

C.交通部门通过大数据监控城市实时路况

D.工业企业通过物联网设备监控设备运行状态

【答案】:A

解析:本题考察大数据应用场景知识点。精准营销的核心是基于用户数据(如行为、偏好)实现个性化推荐。选项A中电商平台通过用户历史购物行为分析实现商品推荐,属于典型的精准营销应用;B属于医疗大数据应用,C属于智慧城市交通管理,D属于工业物联网监控,均不属于精准营销场景,正确答案为A。

5、在大数据预处理中,处理缺失值的常用方法不包括以下哪项?

A.删除记录

B.均值填充

C.插值法

D.直接丢弃原始数据

【答案】:D

解析:本题考察大数据预处理中缺失值处理方法。处理缺失值的常用方法包括:删除记录(适用于缺失比例低且非关键数据)、均值/中位数填充(数值型数据常用)、插值法(线性插值、样条插值等)。选项D“直接丢弃原始数据”不属于常用方法,会导致数据信息大量损失,因此正确答案为D。

6、大数据的Velocity特征主要强调数据的什么特性?

A.数据量巨大

B.产生和处理的速度快

C.数据类型多样

D.数据真实可靠

【答案】:B

解析:本题考察大数据4V特征的定义。大数据的4V特征包括Volume(数据量大)、Velocity(产生和处理速度快)、Variety(数据类型多样)、Veracity(数据真实性)。A选项描述的是Volume特征,C选项描述的是Variety特征,D选项描述的是Veracity特征,因此正确答案为B。

7、以下哪种数据库属于非关系型数据库(NoSQL数据库)?

A.MySQL

B.Oracle

C.MongoDB

D.SQLServer

【答案】:C

解析:本题考察关系型与非关系型数据库知识点。关系型数据库(如A选项MySQL、B选项Oracle、D选项SQLServer)基于关系模型,使用表格结构和SQL语言进行操作,具有严格的表结构和关系约束;C选项MongoDB是文档型NoSQL数据库,属于非关系型数据库,以键值对或文档(如JSON格式)存储数据,灵活扩展,适合非结构化数据存储。因此正确答案为C。

8、Hadoop生态系统中,负责分布式计算任务执行的核心框架是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库工具)

【答案】:B

解析:MapReduce是Hadoop分布式计算框架,专门用于处理海量数据的并行计算任务;HDFS是分布式存储系统,仅负责数据存储;YARN是资源管理系统,不直接执行计算;Hive是数据仓库工具,基于SQL语法操作数据。因此正确答案为B。

9、大数据的4V特征中,不包括以下哪一项?

A.多样性(Variety)

B.可变性(Variability)

C.速度(Velocity)

D.价值(Value)

【答案】:B

解析:本题考

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档