- 4
- 0
- 约4.71千字
- 约 13页
- 2026-03-03 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据分析师面试题与解答
一、选择题(共5题,每题2分,共10分)
1.在处理缺失值时,以下哪种方法在数据量较大且缺失比例不高的情况下通常效果最好?
A.删除含有缺失值的行
B.填充均值或中位数
C.使用模型预测缺失值(如KNN)
D.插值法(如线性插值)
答案:C
解析:当数据量较大且缺失比例不高时,模型预测缺失值(如KNN)能更准确地保留数据特征,避免简单填充方法带来的偏差。删除行会导致数据丢失过多,均值/中位数填充适用于分布均匀的数据,线性插值适用于时间序列数据。
2.以下哪种指标最适合衡量分类模型的预测性能,尤其是在样本不均衡的情况下?
A.准确率(Accuracy)
B.精确率(Precision)
C.召回率(Recall)
D.F1分数(F1-Score)
答案:D
解析:在样本不均衡时,准确率可能被误导(如多数类占90%,模型预测全部为多数类仍得90%准确率)。F1分数是精确率和召回率的调和平均,能综合评估模型性能。精确率关注假阳性,召回率关注假阴性,单一指标可能片面。
3.在数据可视化中,以下哪种图表最适合展示不同类别之间的数量对比?
A.折线图
B.散点图
C.饼图
D.条形图
答案:D
解析:条形图直观展示类别间数量差异,适合离散数据。折线图适合趋势分析,散点图展示相关性,饼
您可能关注的文档
最近下载
- (奇瑞)整车开发流程.ppt VIP
- 阿尔茨海默病的护理查房.ppt VIP
- 国家开放大学电大本科《理工英语3》期末试题及答案(试卷号:1377)4套.pdf
- 乳腺癌患者生命质量测定量表FACT-B中文版(V4.doc VIP
- 最新国家开放大学24306《创业基础》(统设课)期末终考题库及答案.docx VIP
- 维修方案与MSG-3_精品文档.ppt VIP
- ISO_IEC 23894_2023 信息技术人工智能风险管理指南培训课件.pptx VIP
- (正式版)DB46∕T 721-2025 《产业链质量图谱绘制指南》.pdf VIP
- RAZ-O分级阅读小学英语绘本DISCOVERING DINOSAURS(可打印成册).pdf VIP
- 公文写作中常见易错字.docx VIP
原创力文档

文档评论(0)