2026年大数据工程师职业资格考试题库(附答案和详细解析)(0520).docxVIP

  • 1
  • 0
  • 约5.47千字
  • 约 6页
  • 2026-06-02 发布于上海
  • 举报

2026年大数据工程师职业资格考试题库(附答案和详细解析)(0520).docx

大数据工程师职业资格

一、单项选择题(共10题,每题1分,共10分)

下列哪种技术通常用于分布式存储系统中?()A.RAID技术B.HDFSC.NAS存储D.SAN存储答案:B解析:HDFS(HadoopDistributedFileSystem)是专为大数据设计的高容错、高吞吐量的分布式文件系统,符合题意;RAID、NAS、SAN均为传统存储技术,不适用于大数据分布式场景。

MapReduce模型中,Map阶段输出的中间结果通常存储在哪里?()A.内存B.HDFSC.Redis缓存D.MySQL数据库答案:B解析:MapReduce设计时,中间结果会写入HDFS以避免内存溢出;内存仅用于计算,Redis和MySQL是数据存储方案,非中间结果存放地。

下列哪种算法不属于聚类算法?()A.K-MeansB.DBSCANC.决策树D.层次聚类答案:C解析:K-Means、DBSCAN、层次聚类均为聚类算法,用于数据分组;决策树是分类算法,用于预测目标变量。

下列哪个指标最适合评估分类模型的泛化能力?()A.准确率B.精确率C.召回率D.AUC答案:D解析:AUC(AreaUndertheROCCurve)通过绘制ROC曲线评估模型在不同阈值下的综合性能,最能反映泛化能力;其他指标仅评估特定阈值

文档评论(0)

1亿VIP精品文档

相关文档