- 35
- 0
- 约4.23千字
- 约 81页
- 2020-07-26 发布于天津
- 举报
因为达到了 错误未减少 ,所以估计算法停止。表 明超额训练通过添加一个测试样本得到了解决 31 ppt 课件 32 ppt 课件 33 ppt 课件 ? 分类表使用 0.5 作为界限,过于单一,还需要查 看 ROC 曲线。 ? 曲线范围是 ROC 曲线的数字摘要,对于每个类 别,表中的值代表了对于该类别中预测拟概率 ? 例如,对于随机选择的拖欠贷款者与随机选择 的未拖欠贷款者,就缺省模型而言, 前者高于 后者的概率为 0.854. 34 ppt 课件 35 ppt 课件 36 ppt 课件 观察 ? 讲预测分类为 YES 的界限从 0.5 下降到 0.3 ? 大致是第二个箱图的顶端和第四个箱图的低端 ? 可以在不损失大量潜在优质客户的前提下增加 准确找到潜在欠贷者的几率,即 ? 第二个箱图从 0.5 移动到 0.3 ,则细线处相对较 少的未欠贷客户重新预测为欠贷者 ? 而第四个箱图,则大量欠贷客户会被重新正确 的分类为预测欠贷者 37 ppt 课件 38 ppt 课件 39 ppt 课件 40 ppt 课件 案例 2 ? 电信数据 telco.sav ? 电信供应商按照顾客使用习惯将顾客群 分为 4 大类 ? 若得到新客户的数据,可以针对每个用 户提供个性化服务。 ? 当
原创力文档

文档评论(0)