- 1
- 0
- 约7.18千字
- 约 8页
- 2026-05-10 发布于河北
- 举报
数据分析笔试题及详细答案
一、基础概念题(每题5分,共20分)
1.请解释什么是数据清洗,常见的数据清洗操作有哪些?
答案:数据清洗是指对原始数据中存在的错误、缺失、重复、异常等问题进行处理,使数据达到准确、完整、一致的状态,为后续分析建模提供可靠数据的过程。核心目的是“去伪存真”,避免脏数据影响分析结果。
常见操作:
缺失值处理:根据数据情况选择删除(缺失量极少时)、填充(均值、中位数、众数,或根据业务逻辑填充,如“未知”“0”)、插值法(适用于连续型数据);
重复值处理:查找并删除完全重复的行,或根据业务逻辑去重(如同一用户多次提交,保留最新一条);
异常值处理:通过箱线图、Z-score法识别异常值,处理方式包括删除(确认是错误数据)、修正(如录入错误,修正为正确值)、盖帽处理(将异常值替换为合理范围的最值);
数据格式统一:如日期格式标准化(将“2026.04.25”“2026-4-25”统一为“2026-04-25”)、数值格式统一(去除多余小数点、单位统一);
逻辑错误修正:如“年龄为负数”“订单金额为0但有发货记录”等,根据业务逻辑修正或删除。
2.什么是描述性统计?请列举3个常用的描述性统计指标,并说明其含义。
答案:描述性统计是指通过图表、指标等方式,对数据的整体特征进行概括和描述,不涉及推断和预测,核心是“描述数据本身的样子”,是数据分析的基础。
常用指标
您可能关注的文档
- 教练员安全试题及详细答案.docx
- 教师笔试试题及详细答案.docx
- 教师编面试题本及详细答案.docx
- 教师编面试题纸及详细答案.docx
- 教师编音乐学科试题及详细答案.docx
- 教师编招聘考试试题及详细答案.docx
- 教师编制考试模拟试题及详细答案.docx
- 教师教育学心理学考试题及答案(含详细解析).docx
- 教师教育学心理学试题及详细答案.docx
- 教师晋级考核试题及详细答案.docx
- 统编版小学五年级语文下册课件《语文园地六》.pptx
- 9.3 大气压强 课件-2025-2026学年人教版物理八年级下学期.pptx
- 10.《苏武传》第二课时 课件 2026-2027学年统编版高二语文选择性必修中册.pptx
- 统编版小学五年级语文下册课件《第二单元习作:写读后感》.pptx
- 2025-2026学年初二英语下学期期中模拟练习含答案.docx
- 2024-2025学年广东省广州市八年级下学期中段生物检测含答案.docx
- 2024-2025学年广东广州天河中学八年级下学期期中数学试题含答案.docx
- 冀教版八年级数学上《第十二章分式和分式方程》单元测试含答案.doc
- 华东师大八年级数学下《第18章平行四边形》整合提升试卷.doc
- 危重病人生命体征监测.pptx
最近下载
- 2025入党第二季度思想汇报入党积极分子思想汇报(2篇).docx VIP
- 国家开放大学《管理英语4》边学边练Unit 5-8(答案全)_可搜索.pdf VIP
- 烟花爆竹生产经营单位重大生产安全事故隐患判定标准解读.pptx VIP
- GBT 51027-2014石油化工企业总图制图标准1557207405058.pdf
- 2025《水面垃圾清理装置结构计算设计及三维仿真研究》14000字.docx
- 2025年山东泰安市地理生物会考真题试卷(+答案).docx VIP
- 2025年湖南省长沙市长郡教育集团中考三模九年级下数学试卷.pdf VIP
- 2024年河北省承德市隆化县六年级下学期小升初真题精选语文试卷含答案.doc VIP
- 2.1 原始人的创造 教学设计 高中美术湘美版(2019)美术鉴赏.docx VIP
- 南京市鼓楼区2023-2024学年高一下学期期中试卷英语试题(含答案).pdf VIP
原创力文档

文档评论(0)