大数据技术题库及详解.docxVIP

  • 0
  • 0
  • 约1.02万字
  • 约 25页
  • 2026-06-21 发布于上海
  • 举报

大数据技术题库及详解

一、单项选择题(共10题,每题1分,共10分)

主流版本HDFS分布式文件系统的默认数据块大小是?

A.64MB

B.128MB

C.256MB

D.512MB

答案:B

解析:正确选项依据:目前主流的Hadoop2.x及以上版本中,HDFS默认块大小为128MB,该配置可以平衡磁盘寻道开销和数据传输效率。错误选项问题:64MB是Hadoop1.x版本的默认块大小,256MB、512MB属于用户可自定义的块大小配置,不属于默认值。

Spark计算框架的最核心、最基础的数据抽象是?

A.DataFrame

B.DataSet

C.RDD

D.DStream

答案:C

解析:正确选项依据:RDD(弹性分布式数据集)是Spark最早提出的核心数据抽象,所有上层的结构化数据抽象、流处理抽象都是基于RDD封装实现的。错误选项问题:DataFrame、DataSet是Spark后续推出的结构化数据抽象,DStream是SparkStreaming的流数据抽象,三者都依赖RDD实现,不属于最基础的核心抽象。

以下选项中不属于数据仓库核心特性的是?

A.面向事务

B.面向主题

C.集成性

D.时变性

答案:A

解析:正确选项依据:数据仓库的核心定位是支撑OLAP分析场景,不处理高频事务请求,面向事务是传统关系型数据库OLTP场景的核心特性,不属于

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档