- 0
- 0
- 约2.48万字
- 约 39页
- 2026-03-09 发布于山东
- 举报
2026年国开电大大数据技术概论形考题库100道
第一部分单选题(100题)
1、Hadoop分布式文件系统(HDFS)的核心作用是?
A.执行分布式并行计算任务
B.存储海量结构化与非结构化数据
C.提供集群资源调度与管理
D.实时处理高吞吐量流数据
【答案】:B
解析:本题考察Hadoop生态系统核心组件的功能。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式存储系统,核心作用是存储海量数据(包括结构化、半结构化和非结构化数据)。选项A对应MapReduce(分布式计算框架),选项C对应YARN(资源管理器),选项D对应Storm/SparkStreaming(流处理框架),均非HDFS的功能。
2、以下关于数据仓库的描述,正确的是?
A.数据仓库仅用于存储实时产生的业务数据
B.数据仓库的数据通常支持联机事务处理(OLTP)
C.数据仓库是面向主题的、集成的、非易失的数据集
D.数据仓库的数据仅包含结构化数据,不包含非结构化数据
【答案】:C
解析:本题考察数据仓库定义知识点。数据仓库是面向主题(针对特定业务需求)、集成(整合多源数据)、非易失(数据一般不频繁修改)、时变(随时间演化)的数据集,用于支持管理决策,因此C正确。A错误,数据仓库数据多为批处理生成,非实时;B错误,数据仓库主要支持OLAP(联机分析处理),而非OLTP(事务处理);D错误,数据仓库可包含结构化、半结构化、非结构化数据。
3、在大数据存储技术中,MongoDB主要适用于存储以下哪种类型的数据?
A.高度结构化的企业财务数据
B.关系复杂的多表关联业务数据
C.非结构化/半结构化数据(如用户评论)
D.需事务一致性的金融交易数据
【答案】:C
解析:本题考察NoSQL数据库的应用场景。MongoDB是典型的文档型NoSQL数据库,适用于存储非结构化或半结构化数据(如JSON格式的用户评论、图片元数据等),具有灵活的模式设计和高扩展性。A、B、D均属于关系型数据库(如MySQL、Oracle)的典型应用场景,强调结构化和事务一致性。因此正确答案为C。
4、在大数据技术中,用于高效收集和传输大量日志数据的开源工具是?
A.Flume
B.Sqoop
C.Kafka
D.Hive
【答案】:A
解析:本题考察大数据数据采集工具的功能。Flume是Cloudera开源的日志收集系统,可高效处理海量日志数据;B选项Sqoop用于关系型数据库与Hadoop间的数据传输;C选项Kafka是分布式消息队列,用于高吞吐量消息发布与订阅;D选项Hive是基于Hadoop的数据仓库工具,用于数据查询与分析,因此正确答案为A。
5、以下哪项是大数据的典型特征?
A.数据量小
B.处理速度慢
C.数据类型单一
D.数据价值密度低
【答案】:D
解析:大数据的5V特征包括Volume(大量)、Velocity(高速)、Variety(多样)、Veracity(真实)、Value(价值密度低)。A选项数据量小是传统小数据的特点,大数据数据量巨大;B选项处理速度慢不符合大数据‘高速’处理需求;C选项数据类型单一错误,大数据包含结构化、半结构化、非结构化数据(如文本、图像等),类型多样。因此正确答案为D。
6、在Hadoop生态系统中,负责存储海量分布式数据的核心组件是?
A.HDFS(分布式文件系统)
B.MapReduce(分布式计算框架)
C.YARN(资源管理器)
D.Hive(数据仓库工具)
【答案】:A
解析:本题考察Hadoop生态系统组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,专为存储海量数据设计,支持大文件和高容错性;MapReduce是分布式计算框架,负责并行处理数据;YARN负责集群资源管理和任务调度;Hive是基于Hadoop的数据仓库工具,用于SQL类查询。因此正确答案为A。
7、以下哪项不属于大数据的5V特征?
A.容量(Volume)
B.速度(Velocity)
C.多样性(Variety)
D.复杂性(Complexity)
【答案】:D
解析:本题考察大数据5V特征知识点。大数据的5V特征包括容量(Volume)、速度(Velocity)、多样性(Variety)、真实性(Veracity)和价值(Value),选项A、B、C均属于5V特征,而D选项“复杂性”并非5V特征之一,因此正确答案为D。
8、在大数据处理流程中,对数据进行缺失值填充、异常值处理的操作属于以下哪个环节?
A.数据清洗
B.数据集成
C.数据转换
D.数据挖掘
【答案】:A
解
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道附答案(满分必刷).docx
- 2026年国开电大当代中国政治制度形考题库100道含答案(基础题).docx
- 2026年国开电大当代中国政治制度形考题库100道【考点精练】.docx
- 2026年国开电大当代世界经济与政治形考题库100道带答案(基础题).docx
- 2026年国开电大当代世界经济与政治形考题库100道及完整答案【全优】.docx
- 2026年国开电大导游业务形考题库100道附答案【达标题】.docx
- 2026年国开电大导游业务形考题库100道及参考答案【完整版】.docx
- 2026年国开电大大数据技术形考题库100道带答案(完整版).docx
- 2026年国开电大大数据技术形考题库100道及参考答案【培优】.docx
- 2026年国开电大大作业形考题库100道及完整答案(精选题).docx
最近下载
- 学堂在线 雨课堂 学堂云 人工智能原理 章节测试答案.docx VIP
- 1.《归园田居(其一)》课件(共27张PPT)【中职专用】高一语文同步课堂精品(高教版2023基础模块下册).pptx VIP
- 物流系统规划与设计(第2版)高职全套教学课件.pptx
- 北师大版三年级下册数学全册教学设计(配2026年春改版教材).docx
- 2025年哈尔滨科学技术职业学院单招职业适应性测试题库含答案(黄金题型).docx VIP
- 2025年中国旅行社数量及营业收入情况分析,国内旅行社竞争日趋白热化「图.docx VIP
- 中小学生心理咨询记录表.doc VIP
- 2025年AWS认证网络负载均衡器与AWSGlobalAccelerator专题试卷及解析.pdf VIP
- SHT 3005-2016 石油化工自动化仪表选型设计规范.docx VIP
- 哈尔滨科学技术职业学院单招《数学》题库检测试题打印含答案详解(黄金题型).docx VIP
原创力文档

文档评论(0)