- 0
- 0
- 约4.19千字
- 约 11页
- 2026-03-26 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据科学家职位面试攻略及题解
一、统计学与数学基础(共5题,每题8分,总分40分)
1.题目:
假设某城市失业率服从正态分布,均值为5%,标准差为1%。如果随机抽取1000个样本,计算样本失业率超过7%的概率。
答案:
首先,根据中心极限定理,样本均值的分布近似为正态分布,均值为总体均值5%,标准误为σ/√n=1/√1000≈0.0316。
接着,计算Z分数:(7%-5%)/0.0316≈1.58。查标准正态分布表,P(Z1.58)=1-0.9429=0.0571。
因此,样本失业率超过7%的概率约为5.71%。
解析:
此题考察正态分布和中心极限定理的应用。关键在于将实际问题转化为标准正态分布计算,注意样本量较大时才能使用中心极限定理。
2.题目:
某电商A/B测试了两种推荐算法,算法X转化率为3%,算法Y转化率为3.5%。假设分别测试了10000次,用贝叶斯方法更新算法Y的置信区间(α=0.05)。
答案:
先计算先验分布:假设转化率先验为均匀分布。
似然函数:P(X=x|θ)=θ^x(1-θ)^(1-x)。
后验分布与先验分布乘积为似然函数。
计算95%置信区间:需积分求解后验分布的分位数,近似为(3.5±1.96√(3.5×(1-3.5)/10000))=(1.95%,5.05%)。
解析:
此题考察贝叶斯统计方
您可能关注的文档
最近下载
- 2025年3月29日全国事业单位联考A类《综合应用能力》真题及答案.pdf VIP
- ERP沙盘模拟EXCEL表-生产计划.xls VIP
- 中科大发明问题解决理论TRIZ法解读讲义.pdf VIP
- 桥梁防撞护栏施工方案-(1).doc VIP
- 预混燃气燃烧器20155135 RX 360 S PV 20197946 (1) - 02 2022说明书.pdf
- 2026年安徽机电职业技术学院单招职业适应性考试题库及答案详解一套.docx VIP
- 非煤露天矿山环境管理与环境监测计划(完整版).docx VIP
- 小核酸行业系列报告(一):小核酸成药之路——ListeningtotheSoundofSilenceTheRoadtoRNATherapeutics-.pptx VIP
- 安全巡查记录表.doc VIP
- 青少年脊柱侧弯筛查--ppt课件.pptx VIP
原创力文档

文档评论(0)