数据分析师面试知识点与问题集.docxVIP

  • 0
  • 0
  • 约6.13千字
  • 约 14页
  • 2026-03-24 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据分析师面试知识点与问题集

一、统计学基础(共5题,每题6分)

1.问题:某电商平台A/B测试了两种推荐算法,算法X处理了10,000个用户数据,平均转化率为5%;算法Y处理了8,000个用户数据,平均转化率为6%。请问哪种算法更优?请说明统计显著性检验的步骤。

答案:算法Y更优,但需进行统计显著性检验。采用两样本比例Z检验:

-假设检验:H?:p?=p?(两算法转化率无差异),H?:p?≠p?

-样本比例:p?=500/10,000=0.05,p?=480/8,000=0.06

-标准误差:SE=√[(p?(1-p?)/n?)+(p?(1-p?)/n?)]=√[(0.05×0.95/10,000)+(0.06×0.94/8,000)]≈0.0045

-Z值=(p?-p?)/SE=(0.05-0.06)/0.0045≈-2.22

-P值(双尾)≈0.025,若α=0.05,拒绝H?,算法Y显著优于算法X。

2.问题:解释假设检验中的“第一类错误”和“第二类错误”,并举例说明电商场景下如何控制错误率。

答案:第一类错误(α)是拒绝真假设(如误判算法Y优于算法X),第二类错误(β)是接受假假设(如误判算法X不差于算法Y)。电商中可通过增加样本量或调整α值控制,如设置置信区间为95%

文档评论(0)

1亿VIP精品文档

相关文档