数据分析师数据清洗面试题及答案.docxVIP

  • 0
  • 0
  • 约3.96千字
  • 约 12页
  • 2026-03-19 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据分析师数据清洗面试题及答案

一、单选题(共5题,每题2分,总计10分)

1.题目:在数据清洗过程中,以下哪项不属于常见的数据质量问题?

A.缺失值

B.异常值

C.数据重复

D.数据格式统一

答案:D

解析:数据格式统一属于数据预处理阶段的要求,而非数据质量问题。缺失值、异常值、数据重复均属于典型数据质量问题。

2.题目:假设某电商平台用户行为数据中,订单金额存在部分异常值(如999999),以下哪种方法最适合处理此类数据?

A.直接删除异常值

B.将异常值替换为中位数

C.使用分位数(如1%分位数)替换异常值

D.保留异常值,不做处理

答案:C

解析:分位数法能有效保留数据分布特征,同时过滤极端值。直接删除可能丢失信息,中位数对极端值敏感。

3.题目:在处理用户注册信息中的手机号码字段时,以下哪种验证规则最合适?

A.检查是否为空

B.检查是否为纯数字且长度为11位

C.检查是否包含特殊字符

D.检查是否以1开头

答案:B

解析:中国大陆手机号码通常为11位纯数字,验证长度和纯数字属性最核心。其他规则辅助验证。

4.题目:某电商订单表中“购买时间”字段存在部分格式错误(如2026-02-30),以下哪种方法最适合修正?

A.删除错误格式数据

B.将错误日期替换为最近有效日期

C.使

文档评论(0)

1亿VIP精品文档

相关文档