大数据试题及解析.docxVIP

  • 2
  • 0
  • 约1.18万字
  • 约 27页
  • 2026-06-12 发布于江苏
  • 举报

大数据试题及解析

一、单项选择题(共10题,每题1分,共10分)

以下关于大数据核心特征的描述中,说法正确的是

A.大数据的判定标准唯一要求是数据总规模必须超过1TB

B.大数据的多样性特征指所有数据都属于结构化表格数据

C.大数据的时效性特征是区别于传统海量离线数据处理的核心差异点之一

D.大数据的价值密度特征为单位数据中包含的有效价值远高于传统小数据集

答案:C

解析:正确选项C的依据是传统海量数据处理往往允许数小时甚至数天的延迟,而大数据场景下很多业务要求秒级甚至毫秒级的响应速度,时效性是核心差异。A选项错误,大数据的判定维度包含4V特征而非仅以数据量阈值为唯一标准;B选项错误,大数据多样性包含结构化、半结构化、非结构化三类数据,并非仅指结构化数据;D选项错误,大数据的典型特征是价值密度极低,例如小时级的监控视频中可能只有几秒的有效信息。

以下组件中,属于大数据分布式存储类组件的是

A.Flink

B.HDFS

C.Spark

D.ZooKeeper

答案:B

解析:正确选项B的HDFS是Hadoop生态推出的分布式文件系统,专门用于海量大数据的分布式存储。A选项Flink属于分布式实时计算组件;C选项Spark属于分布式通用计算引擎;D选项ZooKeeper属于分布式协调服务组件,均不属于存储类组件。

大数据数据采集环节中,针对网站埋点产生的海量用户行为日志

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档