- 0
- 0
- 约9.87千字
- 约 13页
- 2026-03-24 发布于上海
- 举报
高级数据分析师考试试卷
一、单项选择题(共10题,每题1分,共10分)
以下关于数据清洗的描述中,最合理的处理方式是()
A.直接删除所有含缺失值的记录
B.对所有数值型变量用均值填充缺失值
C.根据业务场景选择填充方法(如时间序列用前向填充,分类变量用众数)
D.对异常值统一用标准差倍数法剔除
答案:C
解析:数据清洗需结合业务场景灵活处理:A选项可能导致数据量大幅损失;B选项忽略分类变量(如“职业”)用均值无意义;D选项未考虑异常值可能是真实业务信号(如极端消费记录)。C选项强调场景适配,符合高级数据分析要求。
在分类模型评估中,当正负样本比例为1:100时,最适合的评估指标是()
A.准确率(Accuracy)
B.F1分数(F1-score)
C.均方误差(MSE)
D.R平方(R2)
答案:B
解析:正负样本极不平衡时,准确率会被多数类主导(如全预测为负类准确率仍达99%),无法反映模型真实性能。F1分数是精确率(Precision)和召回率(Recall)的调和平均,更关注少数类表现;C、D为回归模型指标,不适用分类问题。
某电商平台需分析“用户从浏览到下单的转化漏斗”,最关键的指标拆解维度是()
A.用户性别
B.商品价格带
C.页面加载时长
D.访问渠道(APP/PC/H5)
答案:C
解析:转化漏斗核心关注用户行为路径中的流失点。页面
您可能关注的文档
最近下载
- 消费者权益保护宣传课件.pptx VIP
- Yesterday Once More 歌词中英对照打印版.pdf VIP
- 花生生产技术 花生生产技术 花生病害无公害防治技术.pptx VIP
- 配电室设备定期试验轮换制度.docx VIP
- 高中-数学三年教学基本规划.docx VIP
- 一种聚乙烯基吡啶鎓盐类化合物及其制备方法和应用.pdf VIP
- 麦克维尔风冷螺杆热泵样本PM-MHS3-C005.pdf VIP
- 园林相关昆虫主要目科介绍.ppt VIP
- CNAS-CL01:2018《检测和校准实验室能力认可准则》质量手册 .pdf VIP
- 统编版(2024)新教材小学二年级道德与法治下册第二单元第5课《亲近大自然》课件.pptx VIP
原创力文档

文档评论(0)