- 1
- 0
- 约2.52千字
- 约 8页
- 2026-03-26 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据分析员面试题参考集
一、选择题(共5题,每题2分)
1.在处理缺失值时,以下哪种方法适用于数据分布不均匀的情况?
A.删除含有缺失值的记录
B.均值/中位数/众数填充
C.K最近邻填充
D.回归填充
答案:C
解析:K最近邻填充(KNN)通过考虑样本的局部分布来估计缺失值,适用于数据分布不均匀的情况。均值/中位数填充假设数据近似正态分布,删除记录会丢失信息,回归填充适用于线性关系明显的数据。
2.以下哪个指标最适合衡量分类模型的预测精度?
A.F1分数
B.AUC
C.MAE
D.RMSE
答案:A
解析:F1分数综合考虑精确率和召回率,适用于类别不平衡场景。AUC衡量模型区分能力,MAE/RMSE用于回归问题。
3.在数据可视化中,哪种图表最适合展示时间序列趋势?
A.散点图
B.条形图
C.折线图
D.饼图
答案:C
解析:折线图直观展示时间序列的连续变化,散点图用于展示关系,条形图用于分类数据,饼图用于占比展示。
4.以下哪个工具最适合进行大规模分布式数据处理?
A.Excel
B.Tableau
C.Spark
D.PowerBI
答案:C
解析:Spark支持分布式计算,适合大数据场景;Excel/PowerBI适合小数据量,Tableau偏重可视化。
5.
原创力文档

文档评论(0)