2026年数据处理和机器学习工程师面试参考题.docxVIP

  • 0
  • 0
  • 约5.53千字
  • 约 15页
  • 2026-03-19 发布于福建
  • 举报

2026年数据处理和机器学习工程师面试参考题.docx

第PAGE页共NUMPAGES页

2026年数据处理和机器学习工程师面试参考题

一、编程实现题(共4题,每题10分,总分40分)

背景:针对国内电商行业用户行为数据分析场景,需实现以下功能。

要求:使用Python语言,结合Pandas和NumPy库完成。

1.数据清洗与预处理(10分)

题目:

给定一个包含用户订单信息的DataFrame,其中包含`用户ID`、`商品ID`、`购买时间`(格式为`YYYY-MM-DD`)、`订单金额`和`支付状态`(`已支付`或`未支付`)列。请完成以下任务:

-去除缺失值。

-将`购买时间`转换为`日期`类型。

-添加一列`是否支付`,若`支付状态`为`已支付`则值为1,否则为0。

-对`订单金额`进行标准化(使用Z-score标准化)。

示例输入:

python

importpandasaspd

importnumpyasnp

data={

用户ID:[1,2,3,4,np.nan],

商品ID:[A001,A002,A003,A004,A005],

购买时间:[2023-01-01,2023-01-02,np.nan,2023-01-04,2023-01-05],

订单金额:[100,200,150,np.nan,300],

支付状态:[已支付,未支付,

文档评论(0)

1亿VIP精品文档

相关文档