- 0
- 0
- 约4.49千字
- 约 15页
- 2026-03-27 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据科学家面试题及深度学习参考答案
一、统计学基础(5题,每题6分,共30分)
1.假设检验应用题(6分)
某电商平台A和B希望比较其用户购买转化率是否显著不同。A平台随机抽取1000名用户,转化率为3%;B平台抽取1200名用户,转化率为4%。请设计零假设和备择假设,计算p值,并解释结论对平台运营的启示。
2.回归分析理解题(6分)
在房屋价格预测模型中,发现某个自变量与因变量的关系呈现曲线形态。若要处理这种非线性关系,不改变原始数据的情况下,至少有几种有效方法?请说明原理。
3.贝叶斯方法应用(6分)
某金融风控系统需要预测客户违约概率。已知历史数据显示:违约客户中90%有逾期记录,非违约客户中仅有20%有逾期记录。若随机抽到一位有逾期记录的客户,求该客户实际违约的概率。
4.统计模型选择(6分)
对于时间序列数据预测,若数据呈现明显趋势性和季节性,但无显著自相关性,最适合的模型是什么?请对比ARIMA和LSTM的适用场景。
5.置信区间计算(6分)
某电商抽样调查1000名用户,发现其月均消费额样本均值为1200元,标准差为200元。请计算95%置信区间,并解释其商业含义。
二、机器学习算法(10题,每题5分,共50分)
1.过拟合与欠拟合判断(5分)
某分类模型在训练集上准确率达99%,但在测试集上只有7
原创力文档

文档评论(0)