机器学习算法思想与实践 课件 第5章——特征工程——数据预处理.pptx

机器学习算法思想与实践 课件 第5章——特征工程——数据预处理.pptx

特征工程;特征工程引言;特征工程概述;特征工程概述;特征工程概述;数据预处理;数据预处理;数据清洗;数据预处理对采集到的数据进行加工整理,从大量的可能杂乱无章的或难以理解的数据中抽取并推导出对解决问题有价值的数据,形成适合数据分析的样式,保证数据的一致性和有效性。原始数据可能存在各种问题,例如:异常样本(就像水稻中的杂草)、存在缺失值、不同的属性不属于同一量纲无法直接比较、信息冗余、定性数据不适用于模型等,必须处理掉这些问题为后续模型训练铺平道路。

5.2.1数据清洗

数据清洗是将数据中缺失的值补充完整、消除噪声数据、识别或删除离群点并解决不一致

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档