- 0
- 0
- 约2.51万字
- 约 39页
- 2026-03-10 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、关于数据仓库与数据湖的区别,以下说法正确的是?
A.数据仓库仅存储结构化数据,数据湖可存储多种类型数据
B.数据仓库存储实时数据,数据湖仅存储历史数据
C.数据仓库适合实时分析,数据湖适合离线批处理分析
D.数据仓库和数据湖本质上没有区别,仅为名称差异
【答案】:A
解析:本题考察数据仓库与数据湖的核心概念。数据仓库通常基于结构化数据,面向分析场景,经过清洗和整合;数据湖则是原始数据集合,支持存储结构化、半结构化和非结构化数据,保留原始数据形态。B选项错误,两者均可存储实时和历史数据;C选项错误,两者均支持实时或批处理分析;D选项错误,两者在数据存储方式、应用场景上有本质区别。因此正确答案为A。
2、大数据的“4V”特征中,描述数据产生和处理速度快的是哪个特征?
A.Volume(数据容量)
B.Variety(数据多样性)
C.Velocity(数据速度)
D.Veracity(数据真实性)
【答案】:C
解析:本题考察大数据的基本特征知识点。大数据“4V”特征中,Velocity特指数据产生和处理的速度(如实时流数据处理);Volume指数据规模巨大,Variety指数据类型多样(结构化、半结构化、非结构化),Veracity是数据质量维度(真实性),通常不属于4V核心特征。
3、以下关于Spark与MapReduce的对比,正确的是?
A.Spark只能处理批处理任务,无法处理流数据
B.Spark基于内存计算,比MapReduce更高效
C.Spark不支持分布式计算,仅适用于单机环境
D.Spark的编程模型比MapReduce更复杂
【答案】:B
解析:本题考察大数据计算框架知识点。A错误,Spark支持批处理(SparkBatch)、流处理(SparkStreaming)和交互式查询;B正确,MapReduce基于磁盘I/O执行Map和Reduce,Spark利用内存缓存数据,减少磁盘读写,计算效率更高;C错误,Spark是分布式计算框架,支持集群部署;D错误,Spark提供更简洁的API(如DataFrame、Dataset),编程模型比MapReduce更简单。因此选B。
4、以下哪项不属于大数据的4V核心特征?
A.Veracity(真实性)
B.Volume(规模)
C.Velocity(速度)
D.Variety(多样性)
【答案】:A
解析:本题考察大数据4V特征知识点。大数据的4V标准定义为Volume(数据规模)、Velocity(数据产生和处理速度)、Variety(数据类型多样性)、Value(数据价值密度)。Veracity(数据真实性)通常是扩展的“5V”特征之一,不属于4V核心定义,因此答案为A。
5、相比Hadoop的MapReduce,Spark的显著优势在于?
A.支持内存计算,迭代效率更高
B.仅适用于离线批处理场景
C.必须基于磁盘存储中间结果
D.无法处理实时流数据
【答案】:A
解析:本题考察Spark与MapReduce的对比知识点。Spark采用内存计算模型,中间结果无需频繁读写磁盘,迭代计算效率远高于MapReduce;Spark不仅支持批处理,还可处理实时流数据;MapReduce才需基于磁盘存储中间结果,故正确答案为A。
6、以下哪种数据类型不属于大数据中的非结构化数据?
A.文本文件
B.数据库表
C.图片文件
D.日志文件
【答案】:B
解析:本题考察大数据数据类型知识点。非结构化数据是指格式不固定、难以用二维表结构表示的数据,如文本、图片、视频、日志等。数据库表属于结构化数据,具有固定的字段和格式,因此不属于非结构化数据,正确答案为B。
7、大数据的5V特征中,“Velocity”指的是?
A.数据处理的速度(数据产生和流动的速度)
B.数据的规模(数据量大小)
C.数据的多样性(结构化与非结构化数据并存)
D.数据的价值密度(数据蕴含的价值)
【答案】:A
解析:本题考察大数据的5V特征知识点。大数据的5V特征分别是Volume(数据量)、Velocity(速度)、Variety(多样性)、Veracity(准确性)、Value(价值)。选项A准确描述了Velocity的含义;B对应Volume,C对应Variety,D对应Value,均为错误选项。
8、以下哪种技术适用于实时流数据处理?
A.MapReduce(批处理框架)
B.SparkStreaming(流处理框架)
C.Hive(数据仓库工具)
D.HBase(分布式NoSQL数据库)
【答案】:B
解析:本题考察大数据处理技术应用场
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道附答案【巩固】.docx
- 2026年国开电大道路工程技术形考题库100道及完整答案(网校专用).docx
- 2026年国开电大当代中国政治制度形考题库100道(基础题).docx
- 2026年国开电大当代中国政治制度形考题库100道及完整答案一套.docx
- 2026年国开电大当代世界经济与政治形考题库100道附参考答案(精练).docx
- 2026年国开电大当代世界经济与政治形考题库100道【全国通用】.docx
- 2026年国开电大导游业务形考题库100道必考题.docx
- 2026年国开电大大数据技术概论形考题库100道含答案(实用).docx
- 2026年国开电大大数据技术概论形考题库100道及参考答案【巩固】.docx
- 2026年国开电大大数据技术形考题库100道及答案【各地真题】.docx
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
最近下载
- 《全球粮食安全挑战》课件.ppt VIP
- 医院感染管理办法课件PPT.pptx VIP
- 新公共法语中级教程(吴贤良)习题答案及参考译文.pdf
- 人工智能在司法领域的应用路径与前景分析.docx VIP
- 江西电力职业技术学院单招职业倾向性考试题库及答案详解(真题汇编).docx VIP
- 消化不良ppt课件.pptx VIP
- 2025年广东省外语艺术职业学院单招笔试英语试题库含答案解析.docx VIP
- 2026年忻州职业技术学院单招职业适应性测试题库附答案解析.docx VIP
- 控制计划CP中英文完整范本.xls VIP
- 江西电力职业技术学院单招职业适应性考试题库及答案详解(历年真题).docx VIP
原创力文档

文档评论(0)