- 0
- 0
- 约6.98千字
- 约 11页
- 2026-03-23 发布于上海
- 举报
大数据工程师职业资格考试试卷
一、单项选择题(共10题,每题1分,共10分)
HDFS默认的块大小是?
A.64MB
B.128MB
C.256MB
D.512MB
答案:B
解析:HDFS设计时将块大小默认设置为128MB(早期版本为64MB),较大的块大小减少了NameNode的元数据管理开销,适合大文件存储。错误选项中,64MB是旧版本默认值,256MB和512MB为自定义常见配置,非默认。
Spark的核心抽象是?
A.DataFrame
B.Dataset
C.RDD
D.DStream
答案:C
解析:RDD(弹性分布式数据集)是Spark的核心数据抽象,支持容错、并行操作和惰性计算。DataFrame和Dataset是RDD的高层抽象,DStream是SparkStreaming的时间序列抽象,均非核心。
Kafka的主要用途是?
A.分布式数据库
B.实时计算框架
C.消息队列与流数据平台
D.分布式文件系统
答案:C
解析:Kafka是高吞吐量的分布式消息队列,主要用于处理实时数据流的发布与订阅。错误选项中,分布式数据库对应HBase,实时计算框架对应Flink,分布式文件系统对应HDFS。
数据倾斜的典型表现是?
A.所有任务均匀执行
B.部分任务执行时间显著延长
C.内存占用整体降低
D.CPU利用率全面下降
答案:B
解析:
您可能关注的文档
- 2026年AI产品经理考试题库(附答案和详细解析)(0308).docx
- 2026年数字化转型师考试题库(附答案和详细解析)(0210).docx
- 2026年注册产品设计师考试题库(附答案和详细解析)(0128).docx
- 2026年注册土木工程师考试题库(附答案和详细解析)(0210).docx
- 2026年注册平面设计师考试题库(附答案和详细解析)(0303).docx
- 2026年注册资产管理师(CAMA)考试题库(附答案和详细解析)(0207).docx
- 2026年边缘计算工程师考试题库(附答案和详细解析)(0202).docx
- 2026年造价工程师考试题库(附答案和详细解析)(0304).docx
- 2026年零信任安全架构师考试题库(附答案和详细解析)(0210).docx
- 2026年非营利组织管理师考试题库(附答案和详细解析)(0303).docx
最近下载
- 观夏品牌介绍手册.pdf
- 人教版(2024)八年级下册英语期末复习:Unit 1~8全册短语背诵清单.docx
- 页面提取自-2016中山市城市规划技术标准与准则.pdf VIP
- 高考体育生单招政治历年真题及答案 完整版2025.pdf VIP
- GB50974-2014 消防给水及消火栓系统技术规范.pdf VIP
- 2624复混肥料制造行业系数手册.pdf
- 2026四川安吉物流集团有限公司上半年社会招聘23人(一)备考题库带答案详解.docx VIP
- 2024年武汉新洲区人民医院120急救中心调度员招聘笔试历年参考题库典型考题及考点剖析附带答案详解.docx
- 2025年医疗器械技术人员招聘考试(英语)历年参考题库含答案详解.docx VIP
- 国开电大-工程造价控制-形考作业测验1-4答案.pptx VIP
原创力文档

文档评论(0)