大数据技术习题集及答案.docxVIP

  • 3
  • 0
  • 约8.6千字
  • 约 22页
  • 2026-06-09 发布于上海
  • 举报

大数据技术习题集及答案

一、单项选择题(共10题,每题1分,共10分)

下列选项中不属于大数据公认4V特征的是?

A.数据规模大(Volume)

B.处理速度快(Velocity)

C.数据类型多样(Variety)

D.可靠性高(Veracity)

答案:D

解析:大数据4V特征分别为规模大、速度快、类型多、价值密度低(Value),可靠性高是传统IT系统的通用要求,不属于大数据的核心特征,因此D选项错误。

下列关于HDFS分布式文件系统的描述,正确的是?

A.HDFS默认数据副本数量为2

B.HDFS适用于存储大量小文件的业务场景

C.HDFS采用主从架构部署运行

D.HDFS支持随机数据的高效修改操作

答案:C

解析:A选项错误,HDFS默认副本数为3;B选项错误,大量小文件会占用主节点大量内存资源,HDFS不适合该场景;D选项错误,HDFS为一次写入多次读取的架构,不支持随机修改;C选项描述的主从架构是HDFS的核心部署特征,因此正确。

下列组件中属于分布式资源调度框架的是?

A.HBase

B.YARN

C.Spark

D.Kafka

答案:B

解析:A选项HBase是分布式列存储数据库;C选项Spark是分布式计算框架;D选项Kafka是分布式消息队列;只有B选项YARN是Hadoop生态中的通用资源调度框架,负责为集群中的计算任务分配CPU、内

文档评论(0)

1亿VIP精品文档

相关文档