- 42
- 0
- 约5.52千字
- 约 26页
- 2022-03-21 发布于黑龙江
- 举报
1
机器学习-机器学习项目流程
黄海广 副教授
2021年06月
本章目录
2
01 机器学习项目流程概述
02 数据清洗
03 特征工程
04 数据建模
1.机器学习项目流程概述
3
01 机器学习项目流程概述
02 数据清洗
03 特征工程
04 数据建模
机器学习的一般步骤
4
机器学习的一般步骤
5
数据搜集 数据清洗 特征工程 数据建模
机器学习的一般步骤
6
数据搜集 数据清洗 特征工程 数据建模
• 基于性能指标比较几种机
• 网络下载 • 数据清理和格式化 • 特征工程
器学习模型
• 网络爬虫 • 探索性数据分析(EDA) • 特征选择
• 对最佳模型执行超参数调
• 数据库读取
整
• 开放数据
• 在测试集上评估最佳模型
• ……
• 解释模型结果
• 得出结论
2.数据清洗
7
01 机器学习项目流程概述
02 数据清洗
03 特征工程
04 数据建模
2.数据清洗
8
什么是数据清洗?
数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包
括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后
的数据清理一般是由计算机而不是人工完成。
2.数据清洗
9
数据清理原理
拼写错误 不合法值
脏数据
命名习惯 空 值
数理统计技术 异常检测
数据清理策略、规则
数据挖掘技术
您可能关注的文档
最近下载
- 2021年上海市嘉定区中考英语二模试卷含解析.pdf VIP
- 2025年广东省普通高中学业水平选择性考试生物(详解版).docx VIP
- 宁德市2025-2026学年(上期)高二期末考试数学试卷(含答案).pdf
- 鄂尔多斯职业学院单招《职业适应性测试》真题(达标题)附答案详解.docx VIP
- 2025年四川中科《浅谈肥胖治疗新进展》继续教育习题答案.docx VIP
- 小学三年级数学测量单元试题.docx VIP
- 三菱变频器使用手册-FR-E540 中文版.pdf VIP
- 小升初语文练习题6年级语文.pdf VIP
- 8.1 0—3岁婴幼儿心理发展评价(课件)《0-3岁婴幼儿心理发展与教育》(华东师范大学出版社).pptx VIP
- 《测量》习题3.doc VIP
原创力文档

文档评论(0)