网易数据分析师笔试题及详细答案.docxVIP

  • 0
  • 0
  • 约8.41千字
  • 约 10页
  • 2026-06-25 发布于河北
  • 举报

网易数据分析师笔试题及详细答案

说明:本试卷贴合网易业务场景(游戏、电商、用户行为分析),分为4个部分,总分100分,考试时间90分钟,侧重考察实际操作和业务落地能力,避免理论空谈。

一、基础概念题(每题5分,共20分)

1.请简述数据清洗的核心步骤及常见处理方式,结合网易游戏用户日志数据举例说明(如缺失值、异常值)。

答案:核心步骤:数据校验→缺失值处理→异常值处理→数据标准化→重复值处理(5分)

具体说明(结合网易场景):

1.数据校验:核对游戏用户日志的字段完整性(如user_id、login_time、game_id、online_duration),排除字段缺失、格式错误(如时间格式混乱)的数据;

2.缺失值处理:若user_id缺失,直接删除(无法定位用户,无分析价值);若online_duration(在线时长)缺失,可根据同用户同时间段平均在线时长填充(避免丢失有效用户数据);

3.异常值处理:如online_duration出现10000分钟/天(远超合理范围),判定为异常值,采用四分位法剔除,或替换为该字段的95分位数(避免影响整体分析结果);

4.数据标准化:将不同游戏的在线时长、充值金额统一单位(如统一为“分钟”“元”),便于跨游戏对比;

5.重复值处理:剔除同一user_id、同一时间戳的重复日志(可能是系统重复上报),保留一条有效数据。

文档评论(0)

1亿VIP精品文档

相关文档