数据科学家职位面试攻略及题解.docxVIP

  • 0
  • 0
  • 约4.19千字
  • 约 11页
  • 2026-03-26 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据科学家职位面试攻略及题解

一、统计学与数学基础(共5题,每题8分,总分40分)

1.题目:

假设某城市失业率服从正态分布,均值为5%,标准差为1%。如果随机抽取1000个样本,计算样本失业率超过7%的概率。

答案:

首先,根据中心极限定理,样本均值的分布近似为正态分布,均值为总体均值5%,标准误为σ/√n=1/√1000≈0.0316。

接着,计算Z分数:(7%-5%)/0.0316≈1.58。查标准正态分布表,P(Z1.58)=1-0.9429=0.0571。

因此,样本失业率超过7%的概率约为5.71%。

解析:

此题考察正态分布和中心极限定理的应用。关键在于将实际问题转化为标准正态分布计算,注意样本量较大时才能使用中心极限定理。

2.题目:

某电商A/B测试了两种推荐算法,算法X转化率为3%,算法Y转化率为3.5%。假设分别测试了10000次,用贝叶斯方法更新算法Y的置信区间(α=0.05)。

答案:

先计算先验分布:假设转化率先验为均匀分布。

似然函数:P(X=x|θ)=θ^x(1-θ)^(1-x)。

后验分布与先验分布乘积为似然函数。

计算95%置信区间:需积分求解后验分布的分位数,近似为(3.5±1.96√(3.5×(1-3.5)/10000))=(1.95%,5.05%)。

解析:

此题考察贝叶斯统计方

文档评论(0)

1亿VIP精品文档

相关文档