(2025年)大数据竞赛题库(含答案)
一、数据清洗与预处理
1.某新能源汽车用户行为数据集包含字段:用户ID、注册时间、最近一次充电时间、日均行驶里程(km)、电池健康度(%)。其中“电池健康度”字段缺失率为18%,且缺失数据集中出现在车龄超过5年的车辆记录中。请设计缺失值处理方案,并说明理由。
答案:采用基于车龄分组的中位数填充法。具体步骤:①按车龄(≤5年、5年)将数据集分为两组;②分别计算两组的电池健康度中位数(≤5年组中位数92%,5年组中位数78%);③用对应组的中位数填充缺失值。理由:缺失数据与车龄强相关(车龄越长,电池健康度自然越低),分组填充可保留数据的真实分布特征
您可能关注的文档
- (2025年)《动物营养与饲料》考试题库大全(含答案).docx
- (2025年)《职业生涯规划》节测试答案详解.docx
- (2025年)安全生产应急面试题及答案.docx
- (2025年)初级云计算试题库(附参考答案).docx
- (2025年)大学《电子商务概论》试题及答案.docx
- (2025年)地震灾害知识测试题(附答案).docx
- (2025年)阀门工程测试题及答案.docx
- (2025年)骨伤科三月份护理业务学习及护理查房考试试题附答案.docx
- (2025年)国家开放大学《经济学基础》第十五章测试题及答案解析.docx
- (2025年)丽江市辅警考试题《公安基础知识》综合能力试题库附答案.docx
- 铜陵学院《国际企业战略管理》2023-2024学年第二学期期末试卷.doc
- 2026届黑龙江省鹤岗市中考五模化学试题(含答案解析).doc
- 小学一年级数学练习题(题型全).docx
- 小学一年级数学练习题.docx
- 1991年湖北高考物理真题及答案(OCR).pdf
- 2026年吉林省松原市中考四模化学试题(含答案解析).doc
- 湖北文理学院《数据挖掘与商业智能含实验》2023-2024学年第二学期期末试卷.doc
- 2026届广东省深圳市龙岗区龙岭中学初三毕业班适应性练习卷(数学试题)含解析.doc
- 2025年辽宁省本溪满族自治县数学六上期末学业质量监测试题含解析.doc
- 湖北省宜昌市夷陵区2025届三年级数学第二学期期末检测模拟试题含解析.doc
原创力文档

文档评论(0)