- 0
- 0
- 约2.44万字
- 约 38页
- 2026-03-11 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、以下关于数据仓库(DW)和数据湖(DataLake)的描述,正确的是?
A.数据仓库主要存储结构化数据,数据湖仅存储非结构化数据
B.数据仓库面向主题和历史数据,数据湖更注重原始数据的存储与管理
C.数据仓库更新频率高,数据湖更新频率低
D.数据仓库适合实时分析,数据湖适合批处理分析
【答案】:B
解析:本题考察数据仓库与数据湖的核心区别。数据仓库(DW)是面向主题、集成、时变、非易失的结构化数据集合,用于历史分析和决策支持;数据湖(DataLake)则支持存储结构化、半结构化、非结构化原始数据,强调数据多样性和灵活性,更注重原始数据的存储与管理。选项A错误,数据湖可存储结构化数据;选项C错误,数据湖因存储原始数据,更新频率通常更高;选项D错误,数据仓库适合批处理,数据湖可同时支持批处理和实时分析。
2、大数据的4V特征中,不包括以下哪一项?
A.多样性(Variety)
B.可变性(Variability)
C.速度(Velocity)
D.价值(Value)
【答案】:B
解析:本题考察大数据的4V核心特征知识点。大数据的4V特征包括Volume(容量)、Velocity(速度)、Variety(多样性)、Value(价值)。选项B的“可变性”并非大数据4V特征之一,属于干扰项,因此正确答案为B。
3、大数据的5V特征不包括以下哪一项?
A.Volume(数量)
B.Velocity(速度)
C.Veracity(真实性)
D.Variance(方差)
【答案】:D
解析:本题考察大数据的5V特征知识点。大数据的5V特征为Volume(数量)、Velocity(速度)、Variety(多样性)、Value(价值)、Veracity(真实性),用于描述大数据的核心特性。选项D“Variance(方差)”是统计学中的概念,并非大数据的5V特征之一,因此错误。
4、Hadoop生态系统中,负责分布式存储海量数据的核心组件是?
A.MapReduce(计算框架)
B.YARN(资源管理器)
C.HDFS(分布式文件系统)
D.Hive(数据仓库工具)
【答案】:C
解析:本题考察Hadoop生态系统核心组件知识点。HDFS(分布式文件系统)是Hadoop的核心存储组件,负责将海量数据分布存储在多台服务器上;MapReduce是分布式计算框架,负责并行处理数据;YARN是资源管理器,负责集群资源调度;Hive是基于Hadoop的数据仓库工具,用于数据查询和分析。选项A、B、D均非Hadoop的分布式存储组件,因此正确答案为C。
5、在Hadoop生态系统中,负责分布式存储的核心组件是?
A.HDFS
B.MapReduce
C.YARN
D.Hive
【答案】:A
解析:本题考察Hadoop生态系统核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop的分布式文件系统,负责大数据的分布式存储;MapReduce是分布式计算框架,YARN是资源管理器,Hive是基于Hadoop的数据仓库工具。因此负责分布式存储的是HDFS,正确答案为A。
6、数据预处理中,“去除数据中的噪声、缺失值、重复值”属于哪个环节?
A.数据清洗
B.数据集成
C.数据转换
D.数据规约
【答案】:A
解析:本题考察数据预处理步骤知识点。数据清洗的核心是处理原始数据中的质量问题,包括去除噪声(异常值)、缺失值填充、重复值删除等;数据集成是合并多源数据;数据转换是对数据格式、单位等进行转换;数据规约是在保证信息完整的前提下减少数据规模。因此正确答案为A。
7、以下哪一项不属于大数据的4V特征?
A.Velocity
B.Variety
C.Variability
D.Volume
【答案】:C
解析:本题考察大数据的核心特征(4V)知识点。大数据的4V特征通常指Volume(数据量)、Velocity(数据产生速度)、Variety(数据多样性)、Value(数据价值),而Variability(可变性)并非大数据4V特征的标准组成部分。因此正确答案为C。
8、在大数据处理流程中,用于处理数据噪声、缺失值和重复数据的环节是?
A.数据清洗
B.数据集成
C.数据转换
D.数据归约
【答案】:A
解析:本题考察大数据预处理环节知识点。数据清洗的核心目标是处理数据质量问题,包括去除噪声、填补缺失值、删除重复数据;数据集成是合并多源数据,数据转换是调整数据格式/类型,数据归约是减少数据规模。因此处理数据噪声和缺失值的环节是数据清洗,正确答案为A。
9、在决策
您可能关注的文档
- 2026安徽合肥市朝霞小学代课教师招聘备考题库及答案详解1套.docx
- 2026四川长虹集团财务有限公司招聘财务管理岗等岗位2人备考题库带答案详解.docx
- 2026年上半年黑龙江事业单位联考省营商环境建设监督局招聘6人备考题库含答案详解.docx
- 2026天津市口腔医院专业技术岗位工作人员(劳务派遣制)招聘53人备考题库附答案详解.docx
- 2026山东临沂市郯城县教育和体育局引进优秀人才41人备考试题带答案详解.docx
- 2026四川雅安市国峰人力资源有限责任公司招聘备考题库及参考答案详解.docx
- 2026山东临沂市教育局部分事业单位招聘综合类岗位工作人员3人备考题库及答案详解一套.docx
- 2026年区块链金融行业监管政策影响分析.docx
- 2026年区块链音乐版权保护技术突破方向.docx
- 2026年区块链音乐版权确权法律框架构建.docx
- 高中AI编程教学中深度学习在智慧交通管理中的应用课题报告教学研究课题报告.docx
- 2026年区块链金融行业监管政策体系报告.docx
- 2026年区块链金融行业应用风险控制技术分析.docx
- 2026年区块链金融行业应用风险及监管政策法律风险.docx
- 2026年区块链金融行业应用技术标准报告.docx
- 2026年区块链金融行业应用风险及监管政策行业分析报告.docx
- 2026年区块链金融行业应用风险及监管政策行业动态报告.docx
- 高中生借助地理遥感技术监测水体富营养化与水华爆发规律课题报告教学研究课题报告.docx
- 2026年区块链金融监管政策框架分析报告.docx
- 2026年区块链音乐版权管理技术挑战分析.docx
最近下载
- 2025年四川省从“五方面人员”中选拔乡镇领导班子成员考试历年参考题库含答案详解.docx VIP
- 高中生谈恋爱的危害.docx VIP
- 生产主管岗位月度KPI绩效考核表.docx VIP
- 十五五时期国家教育发展规划.docx
- 《托育机构环境创设》完整全套教学课件.pdf VIP
- 2026春桂美版2024小学美术二年级下册每课教案(附目录).docx VIP
- 校本教材陜北秧歌内容(下).doc VIP
- 传感器技术及其应用第2版作者陈黎敏2温度传感器课件.ppt VIP
- 2024年安徽机电职业技术学院单招职业技能测试题库及答案(各地真题).docx VIP
- 第2单元第1课《观照自然》课件+2025-2026学年人美版初中美术七年级下册.pptx VIP
原创力文档

文档评论(0)