- 0
- 0
- 约2.48万字
- 约 39页
- 2026-03-09 发布于河南
- 举报
2026年国开电大大数据技术形考题库100道
第一部分单选题(100题)
1、以下哪种工具主要用于在关系型数据库与Hadoop之间进行数据导入导出?
A.Flume(日志收集工具)
B.Sqoop(数据传输工具)
C.Kafka(消息队列系统)
D.HBase(分布式数据库)
【答案】:B
解析:Sqoop(SQL-to-Hadoop)是专门设计用于关系型数据库与Hadoop之间批量数据迁移的工具。Flume用于日志实时采集,Kafka用于高吞吐量消息传递,HBase是分布式数据库而非传输工具,因此正确答案为B。
2、在大数据预处理流程中,去除数据中的重复记录、填补缺失值属于哪个步骤?
A.数据清洗(处理脏数据)
B.数据集成(合并多源数据)
C.数据转换(格式与特征转换)
D.数据规约(降维与特征选择)
【答案】:A
解析:本题考察大数据预处理步骤的定义。数据预处理是数据质量提升的关键环节,各步骤功能如下:数据清洗(处理噪声、缺失值、重复记录等“脏数据”)、数据集成(合并不同数据源)、数据转换(如归一化、编码转换)、数据规约(减少数据规模但保留核心信息)。去除重复记录和填补缺失值属于数据清洗的典型操作,因此答案为A。
3、Spark与传统MapReduce相比,显著的性能优势主要得益于?
A.基于内存计算
B.使用磁盘存储数据
C.仅支持批处理任务
您可能关注的文档
- 2026年土木工程师《岩土专业案例》题库100道及答案【典优】.docx
- 2026年国开电大当代世界经济与政治形考题库100道及答案(必刷).docx
- 2026年国开电大导游业务形考题库100道含答案(能力提升).docx
- 2026年国开电大大数据技术概论形考题库100道附完整答案(易错题).docx
- 2026年国开电大大数据技术概论形考题库100道及答案【各地真题】.docx
- 2026年国开电大大数据技术形考题库100道含答案【达标题】.docx
- 2026年国开电大大数据技术形考题库100道及1套参考答案.docx
- 2026年国开电大创新思维训练与方法形考题库100道附完整答案【历年真题】.docx
- 2026年国开电大创业设计形考题库100道附参考答案【基础题】.docx
- 2026年国开电大创业设计形考题库100道及参考答案(完整版).docx
最近下载
- 高级英语Three-Cups-of-Tea课件.ppt VIP
- 一种新型仿人灵巧手的手指关节.pdf VIP
- 一种机械灵巧手手指及灵巧手.pdf VIP
- 福格行为模型(中文版).docx VIP
- 第10课 改革开放和社会主义现代化建设的全面展开教学评大单元教学设计 2026人教统编版历史八年级下册.doc
- 人形机器人本体(关节 灵巧手)竞争格局分析报告_2025年12月.docx VIP
- 机械行业灵巧手专题系列报告3:从运动学原理出发,灵巧手如何“动起来”?.pdf VIP
- 智能三指灵巧手结构设计及验证.pdf VIP
- 新人教版六年级下册数学全册教案(含反思 集体备课).pdf VIP
- 2024-2024年全国高考数学卷汇总(精品).doc VIP
原创力文档

文档评论(0)