大数据测试题及详细答案.docxVIP

  • 1
  • 0
  • 约5.26千字
  • 约 7页
  • 2026-05-08 发布于河北
  • 举报

大数据测试题及详细答案

一、单项选择题(每题5分,共50分)

下列选项中,不属于大数据核心特征的是()

A.海量性(Volume)B.高速性(Velocity)C.单一性(Uniqueness)D.价值性(Value)

Hadoop生态系统中,负责分布式存储的组件是()

A.MapReduceB.HDFSC.YARND.Spark

Spark中,下列哪个操作属于窄依赖()

A.groupByKeyB.reduceByKeyC.mapD.join

数据清洗过程中,处理缺失值的常用方法不包括()

A.删除法B.填充法C.插值法D.加密法

下列哪种文件格式更适合大数据场景下的高效读取和压缩存储()

A.TXTB.CSVC.ParquetD.DOCX

Hive的本质是()

A.分布式数据库B.数据仓库工具C.编程语言D.分布式计算框架

大数据处理流程中,“数据采集”之后的核心步骤是()

A.数据可视化B.数据存储C.数据建模D.

文档评论(0)

1亿VIP精品文档

相关文档