商务智能分类算法解析.ppt

* * * * * * conditional probability tables * * * * * * * * * 增益图 样本比例 真正率 累积真正率 0-20% 33.3% 33.3% 20%-40% 33.3% 66.6% 40%-60% 16.7% 83.3% 60%-80% 16.7% 100% 80%-100% 0 100% 客户编号 预测为类别“是”的概率 真实类别 9 0.9 是 1 0.8 是 3 0.7 是 2 0.7 是 8 0.6 否 4 0.5 是 6 0.4 否 5 0.4 是 7 0.2 否 10 0.1 否 表4.9 测试数据集结果示例 表4.10甘特图示例数据 增益图 ROC 曲线 ROC:receiver operating characteristic (接收者操作特性) Y轴:样本中所含正例样本的个数在正例样本总数中的百分比 X轴:所选样本中的负例样本占测试样本中总负例样本的比例,即假正率 ROC曲线 通常可以通过曲线下包围的面积来衡量模型的性能,面积越大,性能越好。直线下的面积为0.5,通常分类模型对应的曲线下的面积取值范围为0.5~1. FP rate TP rate 0 0 25% 83.3% 50% 100% 75% 100% 100% 100% weka Decision tree classifiers-trees-J4

文档评论(0)

1亿VIP精品文档

相关文档