- 0
- 0
- 约 41页
- 2017-02-08 发布于江苏
- 举报
商务数据挖掘介绍(教授制作)ln学习指导书
5.2.6 标准化数据 一些算法要求在实施算法之前把数据进行标准化。标准化的方法是减去均值再除以标准差。 5.数据准备 5.2预处理数据和清理数据 5.3 划分数据 在有约束学习算法里,预测或分类模型在用于新数据时效果如何评价? 我们对比较各种模型的性能特别感兴趣,因为这样我们就可以选择一个最佳的模型装配到实际系统中。 选择在现有数据上对结果变量进行分类或预测表现最好的模型,这个策略是最好的吗? 5.数据准备 5.3.1 训练数据 通常是划分出的最大数据集合,这部分数据用于建立我们要考察的各种模型。这些模型通常是建立在同一个训练数据集合上。 5.3.2 验证数据 这部分数据用于评价每一个模型的性能,你可以比较这些模型并选择一个最佳模型。 5.3 划分数据 5.数据准备 5.3.3 测试数据 这一部分数据是用于评价被选择的最佳模型在新数据上的性能。 为什么既有验证数据还要有测试数据呢?当我们使用验证数据比较多个模型并挑选出在验证数据上表现最好的模型时,我们有遇到了过分拟和问题-有可能被选择模型刚好对验证数据匹配最好。 5.数据准备 5.3 划分数据 6.建立模型-线性回归的一个例子 目的 预测波士顿居民区域的房屋中间值。 2. 获取数据 我们将使用波士顿房屋统计数据。因为给出的数据集合很小,所以我们不需要从中采样――我们可以把数据全都用上。 3. 探索、清理
您可能关注的文档
- 唐诗宋词精美幻灯片.ppt
- 哲学精品课优秀培训书.ppt
- 唐诗宋词精美幻灯片[].ppt
- 唯物辩证法认识世界和改造世界的根本方法优秀培训书.ppt
- 商业发票学习指导书.ppt
- 商业模式学习指导书.ppt
- 商业研究方法学习指导书.ppt
- 商业研究方法9学习指导书.ppt
- 商业银行海外分支机构 Oversea Sister banks 代理行学习指导书.ppt
- 商业英语入门chapter学习指导书.ppt
- 2025年下半年小学教师资格考试简答题汇总.pdf
- 护理教学比赛资源整合.pptx
- 2022泰和安消防 JTGB-HM-TX3H01 JTGB-HM-TX3H02 TGB-HM-TX3H03 系列点型红外火焰探测器.docx
- 2025年驾驶证资格考试最新最全交通标志大全.pdf
- 护理教学理念:更新与发展.pptx
- 2025年新驾考科目一巧记速记口诀(全国通用).pdf
- 2025年一级建造师《项目管理》黄金预测考点【打印版】.pdf
- 证券公司高级管理人员资质测试章节练习-第一部分综合类第六章至七章:证券投资基金法、信托法.pdf
- 护理教学研究:方法与成果.pptx
- 麻纺车间设备更新准则.docx
原创力文档

文档评论(0)