数据分析笔试题及详细答案.docxVIP

  • 1
  • 0
  • 约7.18千字
  • 约 8页
  • 2026-05-10 发布于河北
  • 举报

数据分析笔试题及详细答案

一、基础概念题(每题5分,共20分)

1.请解释什么是数据清洗,常见的数据清洗操作有哪些?

答案:数据清洗是指对原始数据中存在的错误、缺失、重复、异常等问题进行处理,使数据达到准确、完整、一致的状态,为后续分析建模提供可靠数据的过程。核心目的是“去伪存真”,避免脏数据影响分析结果。

常见操作:

缺失值处理:根据数据情况选择删除(缺失量极少时)、填充(均值、中位数、众数,或根据业务逻辑填充,如“未知”“0”)、插值法(适用于连续型数据);

重复值处理:查找并删除完全重复的行,或根据业务逻辑去重(如同一用户多次提交,保留最新一条);

异常值处理:通过箱线图、Z-score法识别异常值,处理方式包括删除(确认是错误数据)、修正(如录入错误,修正为正确值)、盖帽处理(将异常值替换为合理范围的最值);

数据格式统一:如日期格式标准化(将“2026.04.25”“2026-4-25”统一为“2026-04-25”)、数值格式统一(去除多余小数点、单位统一);

逻辑错误修正:如“年龄为负数”“订单金额为0但有发货记录”等,根据业务逻辑修正或删除。

2.什么是描述性统计?请列举3个常用的描述性统计指标,并说明其含义。

答案:描述性统计是指通过图表、指标等方式,对数据的整体特征进行概括和描述,不涉及推断和预测,核心是“描述数据本身的样子”,是数据分析的基础。

常用指标

文档评论(0)

1亿VIP精品文档

相关文档