大数据技术考试题及详细答案.docxVIP

  • 2
  • 0
  • 约5.07千字
  • 约 6页
  • 2026-05-08 发布于河北
  • 举报

大数据技术考试题及详细答案

一、单项选择题(每题3分,共30分)

1.下列不属于大数据核心特征的是()

A.海量性(Volume)B.高速性(Velocity)C.单一性(Uniqueness)D.价值性(Value)

2.Hadoop生态系统中,负责分布式存储的组件是()

A.MapReduceB.HDFSC.YARND.HBase

3.下列关于MapReduce的描述,错误的是()

A.Map阶段负责数据拆分和处理,输出键值对

B.Reduce阶段负责对Map输出的键值对进行聚合

C.MapReduce适合处理实时流式数据

D.一个MapReduce任务包含多个Map任务和Reduce任务

4.下列哪种数据库属于NoSQL数据库()

A.MySQLB.OracleC.MongoDBD.SQLServer

5.Spark与MapReduce相比,最大的优势是()

A.支持分布式存储B.基于内存计算,速度更快C.只能处理结构化数据D.依赖HDFS存储

6.大数据处理流程中,“数据清洗”的主要目的是()

A.增加数据量B.去除脏数据、异常值,提升数据质量C.加密数据D.压缩数据体积

7.HBase中,用于唯一标识一行数据的是()

A

文档评论(0)

1亿VIP精品文档

相关文档