2026年国开电大大数据技术形考题库100道【能力提升】.docxVIP

  • 1
  • 0
  • 约2.54万字
  • 约 40页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道【能力提升】.docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、在大数据处理的预处理阶段,以下哪个操作主要用于处理数据中的缺失值和异常值?

A.数据清洗

B.数据集成

C.数据转换

D.数据可视化

【答案】:A

解析:本题考察数据预处理操作知识点。数据清洗是预处理的关键步骤,主要用于处理数据中的缺失值(如空值)、异常值(如离群点)、重复值等问题,确保数据质量。数据集成是合并多源数据,数据转换是对数据进行标准化、归一化等格式转换,数据可视化是结果展示,不属于预处理操作。

2、Hadoop分布式文件系统(HDFS)在Hadoop生态系统中的核心作用是?

A.提供分布式计算能力

B.存储海量结构化数据

C.管理分布式数据库

D.实现数据的实时流处理

【答案】:B

解析:本题考察HDFS的功能。HDFS是Hadoop生态系统的核心存储组件,其主要作用是分布式存储海量数据,支持结构化、半结构化和非结构化数据的长期存储。A选项是MapReduce等计算框架的功能,C选项属于HBase或Hive的范畴,D选项属于流处理框架(如Flink、Storm)的功能,因此正确答案为B。

3、Hadoop生态系统中,负责分布式存储海量数据的核心组件是?

A.MapReduce(计算框架)

B.YARN(资源管理器)

C.HDFS(分布式文件系统)

D.Hive(

文档评论(0)

1亿VIP精品文档

相关文档