2026年国开电大大数据技术形考题库100道及完整答案(全国通用).docxVIP

  • 0
  • 0
  • 约2.45万字
  • 约 39页
  • 2026-03-09 发布于河南
  • 举报

2026年国开电大大数据技术形考题库100道及完整答案(全国通用).docx

2026年国开电大大数据技术形考题库100道

第一部分单选题(100题)

1、Hadoop分布式文件系统(HDFS)的英文缩写是?

A.HDFS

B.HBase

C.MapReduce

D.YARN

【答案】:A

解析:本题考察Hadoop生态系统的核心组件知识点。HDFS(HadoopDistributedFileSystem)是Hadoop分布式文件系统的缩写,用于存储海量数据;HBase是基于Hadoop的NoSQL数据库,MapReduce是分布式计算框架,YARN是Hadoop的资源管理器,均不属于分布式文件系统。因此正确答案为A。

2、以下哪个工具主要用于交互式数据探索和商业智能报表制作?

A.Python(需编程实现可视化)

B.Tableau(专业数据可视化工具)

C.Excel(基础表格工具,可视化功能有限)

D.Hadoop(大数据存储计算平台)

【答案】:B

解析:本题考察数据可视化工具应用场景。Tableau是专业的交互式数据可视化工具,专注于BI报表制作和数据探索;Python需通过代码实现可视化(如Matplotlib库),Excel可视化功能简单且非交互式,Hadoop是底层大数据平台而非可视化工具,因此B选项正确。

3、在大数据预处理阶段,以下哪项操作主要用于处理数据中的重复记录和不一致数据?

A.数据清洗

B.数据

文档评论(0)

1亿VIP精品文档

相关文档