- 1
- 0
- 约4.16千字
- 约 11页
- 2026-03-30 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据分析师面试题及统计分析工具应用含答案
一、选择题(共5题,每题2分,共10分)
注:以下题目基于中国市场数字化转型趋势及Python数据分析常用场景设计。
1.在处理缺失值时,以下哪种方法在中国电商用户数据分析中应用最广泛?
A.删除含有缺失值的样本
B.均值/中位数/众数填充
C.KNN填充
D.回归填充
答案:B
解析:中国电商用户数据量庞大但存在缺失,均值/中位数/众数填充因简单高效被广泛采用,尤其对价格、年龄等字段适用。KNN填充计算成本高,回归填充需复杂模型,删除样本会导致信息损失。
2.假设某电商平台用户购买行为数据中,客单价的标准差为50元,样本量为10000,以下哪个结论最可靠?
A.客单价分布呈正态分布
B.95%的用户客单价在450元到550元之间
C.客单价的中位数等于均值
D.数据存在严重偏态
答案:B
解析:根据正态分布特性,样本量足够大时(30),95%数据落在均值±2标准差区间内。此处区间为450-550元(假设均值500元),B选项最符合大数定律。
3.在中国银行业客户流失分析中,以下哪个指标最能反映客户价值?
A.客户数量
B.LTV(生命周期总价值)
C.交易频率
D.平均交易金额
答案:B
解析:LTV综合考虑客户留存时长和贡献,银行业务中长尾客户
原创力文档

文档评论(0)