- 1
- 0
- 约4.51千字
- 约 5页
- 2026-05-19 发布于上海
- 举报
2026年大数据工程师职业资格考试题库(附答案和详细解析)(0512)
大数据工程师职业资格考试试卷
一、单项选择题(共10题,每题1分,共10分)
下列哪种数据存储格式最适合用于大数据场景?A.CSVB.JSONC.ParquetD.XML答案:C解析:Parquet采用列式存储和编码压缩技术,适合分布式计算和存储效率,而CSV、JSON、XML均为行式存储,不适合海量数据处理。
Hadoop生态系统中,用于分布式文件存储的核心组件是?A.HiveB.YARNC.HDFSD.Spark答案:C解析:HDFS(HadoopDistributedFileSystem)是Hadoop的核心文件存储系统,而Hive是数据仓库工具,YARN是资源管理器,Spark是计算框架。
以下哪种算法属于聚类算法?A.决策树B.K-MeansC.神经网络D.支持向量机答案:B解析:K-Means通过距离度量将数据分组,属于聚类算法;决策树是分类算法,神经网络和SVM是监督学习算法。
分布式计算框架Spark中,RDD的主要特性是?A.可持久化B.可恢复性C.分布式存储D.以上都是答案:D解析:RDD(ResilientDistributedDataset)支持持久化、容错和分布式存储,是Spark的核心数据结构。
您可能关注的文档
- 停工停产的通知义务与劳动者知情权.docx
- 危房改造补偿标准争议.docx
- 未成年人校园欺凌案例及责任认定.docx
- 未来的农场作文.docx
- 线上读书会运营计划.docx
- 小学生成语大会策划方案.docx
- 心理咨询培训协议.docx
- 医疗废弃物处理方案.docx
- 医疗设备维保协议.docx
- 影视后期制作委托协议.docx
- CN120037139A 一种极简复合彩色鱼鳞组合物及其制备方法 (中山市美源化妆品有限公司).pdf
- CN120028523A 一种坡耕地氮磷流失的消减方法 (中国农业科学院农业资源与农业区划研究所).pdf
- (正式版)DB4403∕T 230-2022 《海洋灾害预警信号发布规范》.pdf
- (正式版)DB4402∕T 1-2023 《研学旅行服务规范》.pdf
- (正式版)DB4403∕T 209-2021 《禁毒社会工作服务指南》.pdf
- (正式版)DB44∕T 750.2-2010 《技术法规文献题录著录规则 第2部分:中国技术法规》.pdf
- CN120042710A 一种高超声速超燃冲压发动机三维可调尾喷管及其调节方法 (南京航空航天大学).pdf
- CN120028463A 同时检测化妆品中多种多元醇的方法 (上海市食品药品检验研究院).pdf
- (正式版)DB45∕T 2469-2022 《农贸市场畜禽水产品交易管理规范》.pdf
- (正式版)DB44∕T 1135-2013 《废旧小型二次电池回收处置要求》.pdf
原创力文档

文档评论(0)