数据科学家面试题集及答案详解.docxVIP

  • 0
  • 0
  • 约5.35千字
  • 约 22页
  • 2026-03-22 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据科学家面试题集及答案详解

一、统计学基础(5题,每题8分)

题目1

假设某电商平台的用户购买行为数据服从正态分布,已知月均购买次数为12次,标准差为3次。请计算:

1.用户月购买次数在8-16次之间的概率是多少?

2.若要识别异常用户,设定阈值为月购买次数超过20次,该阈值下用户的识别准确率是多少?

题目2

某城市出租车行驶里程数据如下:

-80%的出租车日行驶里程不超过300公里

-90%的出租车日行驶里程不超过400公里

-平均日行驶里程为350公里

请根据这些信息,估算该城市出租车日行驶里程的标准差。

题目3

某金融产品年回报率数据如下:

-期望回报率:8%

-方差:0.025

-峰度:3.2

请计算该产品的:

1.标准差是多少?

2.95%置信区间范围是多少?

3.该分布是否为正态分布?为什么?

题目4

比较以下两种抽样方法:

1.随机抽样

2.分层抽样

在什么情况下哪种抽样方法更优?请结合实际业务场景说明。

题目5

某电商平台的用户转化率测试:

-A方案转化率:5%

-B方案转化率:5.5%

-样本量:各10000人

请计算:

1.统计显著性水平(alpha值)设为0.05时,能否认为B方案显著优于A方案?

2.若要使检测到5%的转化率差异具有95%置信度,需要多少样本量?

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档