- 1
- 0
- 约8.97千字
- 约 12页
- 2026-03-08 发布于江苏
- 举报
高级数据分析师考试试卷(总分100分)
一、单项选择题(共10题,每题1分,共10分)
以下哪项是数据清洗中处理缺失值的最佳实践?
A.直接删除所有包含缺失值的记录
B.对所有数值型变量用均值填充
C.根据业务场景选择删除、填充或建模预测
D.对所有分类变量用众数填充
答案:C
解析:缺失值处理需结合业务场景:若缺失率极低(如5%)可删除记录;若缺失与目标变量相关(如用户未填写收入可能影响消费能力),需用建模预测(如回归填充);分类变量众数填充可能忽略分布差异。选项A可能丢失重要信息,B/D忽略变量特性,故C正确。
在机器学习模型中,L2正则化的主要作用是?
A.防止过拟合,降低模型复杂度
B.提高模型训练速度
C.处理类别不平衡问题
D.增强模型的可解释性
答案:A
解析:L2正则化(岭回归)通过在损失函数中添加权重平方和的惩罚项,限制模型参数大小,避免模型过度拟合训练数据中的噪声,从而降低复杂度。B是梯度下降优化的作用,C需用SMOTE等方法,D是决策树等模型的特性,故A正确。
进行AB测试时,若实验组与对照组的样本量均为1000,p值=0.03,应如何结论?
A.拒绝原假设,实验有效
B.接受原假设,实验无效
C.需增大样本量后重新测试
D.p值小于0.05但接近,结果不可信
答案:A
解析:统计学中通常以α=0.05为显著性阈值,p值0.05时拒绝原假设(原假设为“实验组与对照组无差异”)。样本量1000已满足大数定律,p=0.03表明结果在统计上显著,故A正确。B错误,因假设检验不“接受”原假设;C/D无依据。
时间序列分析中,ARIMA模型的“MA”代表?
A.自回归(AutoRegressive)
B.移动平均(MovingAverage)
C.差分(Integrated)
D.季节调整(Seasonal)
答案:B
解析:ARIMA模型由三部分组成:AR(自回归,p阶)、I(差分,d阶)、MA(移动平均,q阶)。MA项通过过去误差项的线性组合拟合当前值,故B正确。
以下哪种特征工程方法适用于缓解“维度灾难”?
A.独热编码(One-HotEncoding)
B.主成分分析(PCA)
C.特征交叉(FeatureCross)
D.标准化(Standardization)
答案:B
解析:维度灾难指高维数据导致计算复杂度激增和模型性能下降。PCA通过线性变换将高维数据投影到低维空间,保留主要方差,降低维度。A会增加维度,C可能进一步增加维度,D是归一化处理,不影响维度数,故B正确。
数据仓库的核心特性是?
A.实时性与高并发
B.面向主题、集成、稳定、时变
C.支持事务处理(OLTP)
D.基于内存的快速查询
答案:B
解析:数据仓库(DW)是支持管理决策的面向主题的、集成的、非易失的、随时间变化的数据集合。A是数据湖或实时数据库特性,C是OLTP系统(如MySQL)的功能,D是内存数据库特性,故B正确。
在A/B测试中,若实验组的转化率比对照组高5%,但统计检验不显著,最可能的原因是?
A.样本量不足
B.实验周期过短
C.存在辛普森悖论
D.以上都是
答案:D
解析:样本量不足会降低检验效能(Power),导致无法检测到真实差异;实验周期过短可能未覆盖用户行为的时间分布(如周末效应);辛普森悖论指分组内部趋势与整体趋势相反(如实验组包含更多低活跃用户),均可能导致结果不显著,故D正确。
评估分类模型时,F1分数是以下哪两个指标的调和平均?
A.准确率(Accuracy)与召回率(Recall)
B.精确率(Precision)与召回率(Recall)
C.精确率(Precision)与特异度(Specificity)
D.AUC与准确率(Accuracy)
答案:B
解析:F1分数=2(PR)/(P+R),其中P是精确率(正预测中实际为正的比例),R是召回率(实际正例中被正确预测的比例),用于平衡两者在类别不平衡场景下的表现,故B正确。
根据GDPR法规,企业处理用户个人数据时无需满足以下哪项?
A.明确告知用户数据用途
B.获得用户明确同意(Opt-in)
C.提供数据可携带权(DataPortability)
D.对所有数据进行加密存储
答案:D
解析:GDPR要求数据处理需合法、透明(A),通常需用户同意(B),用户有权获取并转移个人数据(C)。但加密存储是“数据安全”的技术手段,非必须(如匿名化数据无需加密),故D错误。
商业分析中,“漏斗分析”的核心目的是?
A.识别用户行为路径中的流失节点
B.比较不同渠道的转化率
C.预测用户未来购买概率
D.分析用户生命周期价值
答案:A
解析:漏斗分析通过分解用户从初始接触
您可能关注的文档
- 2026年二级建造师考试题库(附答案和详细解析)(0125).docx
- 2026年人工智能工程师考试题库(附答案和详细解析)(0116).docx
- 2026年健康评估师考试题库(附答案和详细解析)(0116).docx
- 2026年拍卖从业人员资格考试题库(附答案和详细解析)(0126).docx
- 2026年注册交通工程师考试题库(附答案和详细解析)(0123).docx
- 2026年注册信息系统审计师(CISA)考试题库(附答案和详细解析)(0114).docx
- 2026年注册咨询工程师考试题库(附答案和详细解析)(0113).docx
- 2026年活动策划师考试题库(附答案和详细解析)(0126).docx
- 2026年演出经纪人资格证考试题库(附答案和详细解析)(0119).docx
最近下载
- 深度解析(2026)《GBT 8568-2013铁路行车组织词汇》.pptx VIP
- CRH380B动车组司机台设备及操作上课讲义.ppt VIP
- 2026《W市希望高级中学教学楼工程工程量清单编制及招标控制价计价》10000字.docx
- CRH380A型动车组-司机室讲义.pdf VIP
- 古建修缮工程施工组织设计.doc
- UNI800(2016) 数字式重量变送器使用说明书201808.V8.pdf VIP
- HG∕T 2289-2017 可曲挠橡胶接头.docx VIP
- 《HG 2289-1992 可曲挠橡胶接头》(2026年)实施指南.pptx VIP
- HG∕T 2289-2017 可曲挠橡胶接头.pdf VIP
- 【常考易错思维应用题母题】三下数学.pdf
原创力文档

文档评论(0)