- 0
- 0
- 约2.49万字
- 约 39页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、数据预处理中处理缺失值、异常值及重复记录的环节属于哪个步骤?
A.数据集成(合并多源数据)
B.数据清洗(处理数据质量问题)
C.数据转换(格式/单位转换)
D.数据规约(降低数据规模)
【答案】:B
解析:本题考察数据预处理环节知识点。数据清洗是处理数据质量问题的核心步骤,包括缺失值填充、异常值处理、重复记录去重等;数据集成是合并多源数据,数据转换是调整数据格式/类型,数据规约是通过降维/采样减少数据量,均与“处理缺失值、异常值”无关。
2、下列哪个工具通常用于实时采集分布式系统中的日志数据?
A.Sqoop
B.Flume
C.Kafka
D.Hive
【答案】:B
解析:本题考察大数据数据采集工具的功能,正确答案为B。Flume是Cloudera开源的分布式日志收集系统,专为实时采集分布式系统中的日志数据设计。A选项Sqoop主要用于Hadoop与关系型数据库之间的数据批量导入/导出;C选项Kafka是高吞吐量的分布式消息队列,主要用于数据传输和异步通信,而非实时日志采集;D选项Hive是基于Hadoop的数据仓库工具,用于数据存储和分析,不具备数据采集功能。
3、国开电大大数据技术课程中常见的企业级数据可视化与商业智能(BI)工具是?
A.Tableau
B.Pytho
您可能关注的文档
- 2026年国开电大道路工程技术形考题库100道及参考答案【基础题】.docx
- 2026年国开电大当代中国政治制度形考题库100道及一套答案.docx
- 2026年国开电大大数据技术概论形考题库100道及答案【真题汇编】.docx
- 2026年国开电大大数据技术形考题库100道附答案(满分必刷).docx
- 2026年国开电大大数据技术形考题库100道含答案【综合题】.docx
- 2026年国开电大大作业形考题库100道及答案(最新).docx
- 2026年国开电大大作业形考题库100道【夺分金卷】.docx
- 2026年国开电大创新思维训练与方法形考题库100道(精选题).docx
- 2026年国开电大创业机会与商业模式形考题库100道及答案(名校卷).docx
- 2026年国开电大创业教育(创业教育专)形考题库100道含答案【预热题】.docx
- 配电室安全工作管理规定.docx
- 结构专业图纸审查要点.docx
- 2.2 养成亲社会行为(课件)-八年级道德与法治上册(统编版2024).pptx
- 3.1 做有梦想的少年(课件)七年级道德与法治上册课件(统编版2024).pptx
- Inventions Unit 4 Section 4 & Project(拓展优质课)八年级英语上册(沪教版2024).pptx
- 2026加油站风险点告知卡汇编附管控清单.pptx
- 2026年五一节前暨节后复工全员安全培训:安全为了谁?.pptx
- 2026年新版学习贯彻关于安全生产重要论述精神.pptx
- 第2章 细胞的分子组成(复习课件)高中生物沪科版2020必修1.pptx
- 第四单元 多姿多彩的乐音世界——《唱脸谱》课件 湘艺版(2024)初中音乐七年级下册.pptx
原创力文档

文档评论(0)