- 2
- 0
- 约2.51万字
- 约 39页
- 2026-03-10 发布于河南
- 举报
2026年国开电大大数据技术概论形考题库100道
第一部分单选题(100题)
1、以下哪种数据类型属于大数据中的非结构化数据?
A.关系型数据库表中的数据
B.服务器日志文件中的原始数据
C.Excel表格中的结构化数据
D.JSON格式存储的半结构化数据
【答案】:B
解析:本题考察大数据数据类型分类知识点。非结构化数据指无固定数据结构、难以用二维表表示的数据,如日志文件、图片、音频等;A选项为结构化数据(关系型数据库表),C选项为典型结构化数据,D选项JSON属于半结构化数据。服务器日志文件通常无固定格式,属于非结构化数据,因此正确答案为B。
2、Hadoop分布式文件系统(HDFS)的主要特点不包括以下哪项?
A.采用副本机制提高容错性
B.支持GB级甚至TB级文件存储
C.支持实时随机读写操作
D.适合存储大型数据集
【答案】:C
解析:本题考察HDFS的核心特性。HDFS采用副本机制(默认3副本)确保数据可靠性(A对);其设计目标是存储大文件,支持GB/TB级数据存储(B、D对);但HDFS优化顺序读写,随机读写性能较差,无法支持实时随机读写操作(C错)。
3、Hadoop生态系统中,负责分布式数据存储的核心组件是?
A.HDFS(分布式文件系统)
B.MapReduce(分布式计算框架)
C.YARN(资源管理器)
D.Hive(数据仓库
原创力文档

文档评论(0)