2026年国开电大大数据技术概论形考题库100道及参考答案(模拟题).docxVIP

  • 2
  • 0
  • 约2.51万字
  • 约 39页
  • 2026-03-10 发布于河南
  • 举报

2026年国开电大大数据技术概论形考题库100道及参考答案(模拟题).docx

2026年国开电大大数据技术概论形考题库100道

第一部分单选题(100题)

1、以下哪种数据类型属于大数据中的非结构化数据?

A.关系型数据库表中的数据

B.服务器日志文件中的原始数据

C.Excel表格中的结构化数据

D.JSON格式存储的半结构化数据

【答案】:B

解析:本题考察大数据数据类型分类知识点。非结构化数据指无固定数据结构、难以用二维表表示的数据,如日志文件、图片、音频等;A选项为结构化数据(关系型数据库表),C选项为典型结构化数据,D选项JSON属于半结构化数据。服务器日志文件通常无固定格式,属于非结构化数据,因此正确答案为B。

2、Hadoop分布式文件系统(HDFS)的主要特点不包括以下哪项?

A.采用副本机制提高容错性

B.支持GB级甚至TB级文件存储

C.支持实时随机读写操作

D.适合存储大型数据集

【答案】:C

解析:本题考察HDFS的核心特性。HDFS采用副本机制(默认3副本)确保数据可靠性(A对);其设计目标是存储大文件,支持GB/TB级数据存储(B、D对);但HDFS优化顺序读写,随机读写性能较差,无法支持实时随机读写操作(C错)。

3、Hadoop生态系统中,负责分布式数据存储的核心组件是?

A.HDFS(分布式文件系统)

B.MapReduce(分布式计算框架)

C.YARN(资源管理器)

D.Hive(数据仓库

文档评论(0)

1亿VIP精品文档

相关文档