2025云南大数据分析师岗位笔试真题及答案汇总.docVIP

  • 3
  • 0
  • 约3.53千字
  • 约 6页
  • 2026-06-29 发布于北京
  • 举报

2025云南大数据分析师岗位笔试真题及答案汇总.doc

2025云南大数据分析师岗位笔试真题及答案汇总

一、单项选择题,(总共10题,每题2分)

1.在Hadoop生态中,负责资源管理与任务调度的核心组件是

A.Hive?B.YARN?C.HBase?D.Sqoop

2.下列哪一项最能描述Kafka的LogCompaction机制

A.按时间窗口删除旧消息?B.仅保留每个Key最新Value?C.压缩传输带宽?D.副本同步策略

3.使用Python进行数据清洗时,dropna参数thresh=3的含义是

A.保留缺失值少于3的行?B.删除缺失值大于3的行?C.保留至少3个非缺失值的行?D.填充3个缺失值

4.在SparkSQL中,将DataFrame注册为临时视图的命令是

A.cache()?B.createOrReplaceTempView()?C.persist()?D.registerTable()

5.若某电商订单表需按用户ID分桶存储,最合适的文件格式是

A.CSV?B.JSON?C.ORC?D.Text

6.对高维稀疏特征进行降维时,首选方法通常是

A.PCA?B.t-SNE?C.TruncatedSVD?D.LDA

7.在Flink中,用于保证Exactly-Once语义的核心机制是

A.Checkp

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档