特征工程;特征工程引言;特征工程概述;特征工程概述;特征工程概述;数据预处理;数据预处理;数据清洗;数据预处理对采集到的数据进行加工整理,从大量的可能杂乱无章的或难以理解的数据中抽取并推导出对解决问题有价值的数据,形成适合数据分析的样式,保证数据的一致性和有效性。原始数据可能存在各种问题,例如:异常样本(就像水稻中的杂草)、存在缺失值、不同的属性不属于同一量纲无法直接比较、信息冗余、定性数据不适用于模型等,必须处理掉这些问题为后续模型训练铺平道路。
5.2.1数据清洗
数据清洗是将数据中缺失的值补充完整、消除噪声数据、识别或删除离群点并解决不一致
您可能关注的文档
- 机器学习算法思想与实践 课件 第1章——绪论.pptx
- 机器学习算法思想与实践 课件 第6章——机器学习算法——最近邻学习.pptx
- 机器学习算法思想与实践 课件 第3章——分类的性能度量.pptx
- 机器学习算法思想与实践 课件 第5 章——特征工程——特征选择.pptx
- 机器学习算法思想与实践 课件 第5章——特征工程——特征降维.pptx
- 机器学习算法思想与实践 课件 第2章——相似度计算方法.pptx
- 机器学习算法思想与实践 课件 第3章——回归的性能度量.pptx
- 机器学习算法思想与实践 课件 第4章——数据收集与质量控制.pptx
- Unit 1 Back to school Period 4(教学设计)高中英语译林版2020必修第一册.docx
- Unit 2 Let’s talk teens Period 3 (教学设计)高中英语译林版2020必修第一册.docx
- 6.1 亚洲的自然环境特征教学设计( 第2课时)地理七年级下学期商务星球版(2024).docx
- Unit 3 Getting along with others(教学设计)英语译林版2020必修第一册.docx
- Unit 3 Getting along with others Period 3(教学设计)英语译林版2020必修第一册.docx
- Unit 3 Getting along with others Period 4(教学设计)高中英语译林版2020必修第一册.docx
- Unit 5Humans and Nature Period 3(教学设计)高中英语北师大版2019必修第二册.docx
- 第一节 能量的转化与守恒(讲义)物理沪科版2024九年级全一册.docx
- 第19讲 机械能守恒定律及其应用(复习讲义)高考物理一轮复习.docx
- 第11讲 氧化还原反应的应用-氯气制备 新高一化学讲义(鲁科版2019).docx
- 第一章 运动的描述(复习讲义)高中物理人教版2019必修第一册.docx
- 2.1 烷烃-高二化学(人教版2019选择性必修3).docx
原创力文档

文档评论(0)