- 0
- 0
- 约4.37千字
- 约 12页
- 2026-03-13 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据科学家招聘面试题库参考
一、统计学基础题(共5题,每题10分)
题目1:
假设你正在分析某电商平台用户的购买行为数据,发现用户的平均购买金额为200元,标准差为50元。如果数据近似服从正态分布,请计算购买金额在150元至250元之间的用户占比是多少?
答案与解析:
根据正态分布的性质,平均值±1个标准差包含约68.27%的数据,平均值±2个标准差包含约95.45%的数据。
-150元对应平均值-1个标准差(200-50),250元对应平均值+1个标准差(200+50)。
-因此,购买金额在150元至250元之间的用户占比约为68.27%。
题目2:
某城市空气质量监测数据显示,PM2.5浓度的中位数是35微克/立方米,第75百分位数是50微克/立方米。如果数据呈现右偏态分布,请推测第25百分位数可能是多少?
答案与解析:
右偏态分布意味着大部分数据集中在低值区域,高值部分拖长尾部。
-中位数(50)大于第25百分位数,且第75百分位数(50)接近中位数,说明数据右偏不明显。
-假设第25百分位数约为25微克/立方米(需结合实际数据验证)。
题目3:
你收集了某银行1000名客户的信用评分数据,发现评分的方差为100。如果信用评分近似服从正态分布,请计算评分低于400分(假设评分范围0-1000)的客户比例。
答案
原创力文档

文档评论(0)