- 1、本文档共3页,其中可免费阅读2页,需付费50金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据清洗和预处理方法
1.数据清洗
采集到的数据通常包含噪声和错误,称为“脏数据”,需要进行数据清洗。经过数据清洗,将存在错误的、缺失的,处理为正确、完整的可分析数据。数据清洗方法主要包括去除重复数据、填补缺失数据、处理异常数据等。见表2-9。
表2-9数据清洗的方法
清洗
内容说明
去除重复数据
通过比较数据集内的记录,识别并删除重复的记录,确保每条记录的唯一性
处理缺失值
对于数据集中的缺失值,可以选择多种处理方式。常见的包括删除含有缺失值的记录,或使用均值、中位数、众数等统计值进行填充,也可以使用基于模型(如回归模型)预测的值进行填补
错误数据修正
识别并修正数据中的错误,如拼写错误、逻
您可能关注的文档
- 人工智能通识 考题及答案 Chap 12 智能商务-题库.docx
- 人工智能通识 考题及答案 Chap4 深度学习题库.docx
- 人工智能通识 考题及答案 Chap13人工智能在航天领域的应用题库.docx
- 人工智能通识 实践任务报告 Chap 1 人工智能概述——课程实践.doc
- 人工智能通识 实践任务报告 chap 2电影数据处理.doc
- 人工智能通识 实践任务报告 Chap 3 机器学习-课程实验.doc
- 人工智能通识 实践任务报告 Chap 4 深度学习-课程实验.doc
- 人工智能通识 实践任务报告 Chap 6 人工智能伦理--课程实践.doc
- 人工智能通识 实践任务报告 Chap 8 人工智能在医疗领域中的应用--课程实验.doc
- 人工智能通识 实践任务报告 Chap 9 人工智能在交通领域的应用--课程实践.doc
- 《人工智能通识》Chap 2 【知识拓展】云存储技术.doc
- 《人工智能通识》Chap 2 【知识拓展】知心天气可视化.doc
- 《人工智能通识》Chap 3 【知识拓展】房价预估Python代码.docx
- 《人工智能通识》Chap 3 【知识拓展】机器学习的其他分类方法.docx
- 《人工智能通识》Chap 3 【知识拓展】随机森林.docx
- 《人工智能通识》Chap 3 【知识拓展】鸢尾花聚类Python代码.docx
- 《人工智能通识》Chap 4【知识拓展】人工鱼基本行为.docx
- 《人工智能通识》Chap 10 【知识拓展】基于AI与生物识别技术的智能燃气灶.docx
- 《人工智能通识》Chap 10 【知识拓展】人脸识别开放平台.docx
- 《人工智能通识》Chap 10 【知识拓展】人脸识别身份验证实验.docx
最近下载
- 《建筑抗震设计规范》(GB50011-2010)正式版.PDF VIP
- 一种用于辅助降血糖的保健食品及其制备方法.pdf VIP
- 糖尿病性视网膜病变科普讲座课件.pptx VIP
- 新概念英语第三册课文翻译及学习笔记:Lesson7.docx VIP
- GB∕T_18710-2002_风电场风能资源评估方法.docx VIP
- 初二深圳数学试卷.docx VIP
- 供货方案人员配备方案.docx VIP
- 2026版本最新欧洲euro-ncap-supporting-protocol-safe-driving-crash-avoidance-virtual-testing-v09.pdf VIP
- 稻虾共养可行性报告.pptx
- 整体性治理视角下西江航运干线船闸管理体制研究的中期报告.docx VIP
文档评论(0)