- 2
- 0
- 约2.71千字
- 约 7页
- 2026-05-19 发布于山东
- 举报
大数据分析工程师考试试卷及答案
试题部分
一、填空题(共10题,每题1分)
1.Hadoop生态中负责分布式存储的核心组件是______。
2.Spark的核心数据抽象是______。
3.无监督学习算法K-means的核心目标是最小化______。
4.流处理框架Flink的核心特性是______。
5.HBase是一种______型NoSQL数据库。
6.SparkSQL中加载JSON数据的函数是______。
7.数据仓库的核心设计方法是______。
8.Kafka中存储消息的基本单元是______。
9.机器学习中用于回归任务的经典算法是______。
10.HDFS默认的文件块大小是______MB。
二、单项选择题(共10题,每题2分)
1.以下属于Hadoop核心组件的是?
A.MySQLB.HDFSC.RedisD.Elasticsearch
2.Spark中属于转换操作的是?
A.count()B.collect()C.map()D.first()
3.用于数据仓库查询分析的工具是?
A.HiveB.KafkaC.ZookeeperD.Flume
4.K-means算法的初始聚类中心会影响?
A.聚类结果B.数据规模C.输入类型D.存储成本
5.以下属于NoSQL数据库的是?
A.PostgreSQLB.MongoDBC.OracleD.SQLServer
6.
您可能关注的文档
最近下载
- 《水力学》课件——第7章 孔口、管嘴出流和有压管流.ppt VIP
- 人音版音乐一年级上册第3课《国旗国旗真美丽》课件(19张PPT内嵌音视频).pptx VIP
- 公安联考面试题库大全及答案.docx VIP
- 赢创特种化学(上海)有限公司特殊护理有机化学品.pdf VIP
- T∕ZZB 1140-2019 家用电热毛巾架团体标准.pdf VIP
- 金属非金属矿山安全生产责任制.docx VIP
- 2024高考数学二轮复习重难点专题《三角函数零点与恒成立问题四大题型》题型突破及解析.doc VIP
- 《土壤侵入体及砾石含量的调查方法》.docx VIP
- 二、三级公路养护作业控制区布置.pptx VIP
- 2026年执法证考试题库附答案.docx VIP
原创力文档

文档评论(0)