- 2
- 0
- 约4.37千字
- 约 15页
- 2026-01-06 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据分析师考试大纲含答案
一、选择题(共20题,每题2分,合计40分)
1.题目:在处理缺失值时,以下哪种方法最适用于连续型数据且能保留数据分布特征?
A.删除含有缺失值的行
B.使用均值或中位数填充
C.使用众数填充
D.K最近邻填充
答案:B
解析:均值或中位数填充适用于连续型数据,能较好地保留数据分布特征。删除行会造成数据损失,众数填充适用于分类数据,K最近邻填充计算复杂。
2.题目:以下哪种指标最适合衡量分类模型的预测准确性?
A.F1分数
B.AUC
C.召回率
D.精确率
答案:A
解析:F1分数综合考虑精确率和召回率,适用于类别不平衡场景。AUC衡量模型区分能力,召回率关注漏报率,精确率关注误报率。
3.题目:在时间序列分析中,ARIMA模型的适用前提是什么?
A.数据必须线性
B.数据具有明显的季节性
C.数据必须是平稳的
D.数据必须符合正态分布
答案:C
解析:ARIMA模型要求时间序列平稳,否则需进行差分处理。线性、季节性、正态分布并非必要条件。
4.题目:以下哪种方法最适合处理大规模稀疏数据?
A.矩阵分解
B.K-Means聚类
C.主成分分析(PCA)
D.Apriori算法
答案:A
解析:矩阵分解适用于稀疏数据,能减少存储和计算量。K-Means对稀疏数
原创力文档

文档评论(0)