- 3
- 0
- 约1.06万字
- 约 24页
- 2026-07-05 发布于上海
- 举报
SparkStreaming流处理试卷及详解
一、单项选择题(共10题,每题1分,共10分)
SparkStreaming的核心数据抽象是以下哪一项?
A.RDD
B.DStream
C.DataFrame
D.DataSet
答案:B
解析:DStream(离散流)是SparkStreaming独有的核心抽象,本质是按时间分片的RDD序列,对应每个微批次的数据集。选项A是SparkCore的核心抽象,选项C、D是SparkSQL的核心抽象,均不符合题意。
SparkStreaming中决定微批次划分粒度的核心参数是?
A.批次间隔
B.窗口长度
C.滑动步长
D.执行时长
答案:A
解析:批次间隔是用户初始化StreamingContext时设置的时间参数,是划分微批次的核心依据,也是任务提交的最小时间单位。选项B、C是窗口操作的专属参数,选项D是单批次任务的实际运行时长,均不能决定批次划分粒度。
下列属于SparkStreaming核心包自带、无需额外引入依赖的输入源是?
A.HDFS文件目录源
B.Kafka数据源
C.Flume数据源
D.Kinesis数据源
答案:A
解析:SparkStreaming核心包仅内置了文件目录源、TCP套接字源两类基础数据源,Kafka、Flume、Kinesis均属于第三方集成数据源,需要引入对应的连接器依赖才
您可能关注的文档
- 2026年加拿大注册会计师(CPACanada)考试题库(附答案和详细解析)(0609).docx
- 2026年劳动关系协调师考试题库(附答案和详细解析)(0526).docx
- 2026年大数据工程师职业资格考试题库(附答案和详细解析)(0605).docx
- 2026年导游资格考试考试题库(附答案和详细解析)(0525).docx
- 2026年工业互联网工程师考试题库(附答案和详细解析)(0524).docx
- 2026年房地产估价师考试题库(附答案和详细解析)(0605).docx
- 2026年数据可视化设计师考试题库(附答案和详细解析)(0524).docx
- 2026年注册安全工程师考试题库(附答案和详细解析)(0524).docx
- 2026年美国注册管理会计师(CMA)考试题库(附答案和详细解析)(0614).docx
- SQL优化在大型数据仓库查询中的应用.docx
原创力文档

文档评论(0)