- 0
- 0
- 约2.5万字
- 约 39页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、在大数据处理流程中,以下哪个步骤主要用于处理数据中的缺失值、异常值和重复值?
A.数据清洗
B.数据集成
C.数据转换
D.数据规约
【答案】:A
解析:本题考察大数据预处理步骤知识点。数据清洗的核心任务是处理数据质量问题,包括缺失值填充、异常值修正、重复值删除等;数据集成是合并多源数据,数据转换是调整数据格式,数据规约是降低数据规模。因此正确答案为A。
2、大数据的哪个特征体现了数据产生和处理的速度要求?
A.Volume(数据量)
B.Velocity(速度)
C.Variety(多样性)
D.Value(价值密度)
【答案】:B
解析:本题考察大数据的5V特征知识点。大数据的5V特征中,Velocity(速度)特指数据产生和处理的速度要求,例如实时流数据的快速处理;Volume(A选项)指数据量大小,强调数据规模;Variety(C选项)指数据类型多样(结构化、半结构化、非结构化);Value(D选项)指数据价值密度低,需通过分析挖掘价值。因此正确答案为B。
3、Hadoop生态系统中,负责分布式数据存储的核心组件是?
A.MapReduce
B.YARN
C.HDFS
D.Hive
【答案】:C
解析:HDFS(HadoopDistributedFileSys
您可能关注的文档
最近下载
- (2026版)批评与自我批评发言稿.pdf VIP
- 高频精选:全国计算机一级考试题库wps及答案.doc VIP
- 春季老年人呼吸道疾病预防与健康管理(1).pptx
- (高级)设备点检员(电气)技能鉴定考试题库-下(多选、判断题汇总).docx
- 延安市辅警考试真题及答案2025年.docx
- 安装工程建设工程计量与计价实务-2022年(浙江)二级造价工程师《安装实务》真题.docx VIP
- 亚低温治疗新生儿缺氧缺血性脑病专家共识(2022).pptx VIP
- “学习贯彻党的创新理论、加强党性锤炼、联系服务群众、发挥先锋模范作用、改作风树新风”对照检查八篇.docx VIP
- 公益创投项目申报书公益创投项目申报书.doc VIP
- 资产管理 人工智能大模型技术应用指南.pdf VIP
原创力文档

文档评论(0)