2026年数据工程师专业能力面试题目解析.docxVIP

  • 0
  • 0
  • 约6.74千字
  • 约 18页
  • 2026-03-11 发布于福建
  • 举报

2026年数据工程师专业能力面试题目解析.docx

第PAGE页共NUMPAGES页

2026年数据工程师专业能力面试题目解析

一、编程与算法题(共3题,每题10分,总分30分)

1.数据清洗与预处理编程题(10分)

题目:

假设你接收到一份包含缺失值、异常值和重复记录的CSV文件,数据字段包括`用户ID`(字符串)、`注册时间`(字符串,格式为YYYY-MM-DDHH:MM:SS)、`消费金额`(浮点数)、`城市`(字符串)。请用Python(Pandas库)完成以下任务:

(1)删除重复的`用户ID`记录;

(2)将`注册时间`转换为`datetime`类型,并填充缺失值为当前时间;

(3)对`消费金额`进行异常值检测(使用3σ原则),将超出范围的值替换为该字段的中位数;

(4)将`城市`中的缺失值填充为该城市出现次数最多的值。

答案与解析:

python

importpandasaspd

importnumpyasnp

fromdatetimeimportdatetime

示例数据

data={

用户ID:[U001,U002,U001,U003,None],

注册时间:[2025-01-0112:00:00,2025-01-0208:30:00,2025-01-0112:00:00,None,2025-01-0314:00:00],

消费金额:[120.5

文档评论(0)

1亿VIP精品文档

相关文档