7.第八章数据挖掘模型评估.pptVIP

下载本文档

45
0
约5.68千字
约 42页
2017-05-21 发布于四川
举报

7.第八章数据挖掘模型评估.ppt

Response rate =预测会违约且实际会违约/所有预测会违约 =66/(66+28)=70.21% 预测模型回应率的高低须和总体回应率比较：总体response rate =总体实际会违约/总体=(66+185)/(66+185+28+721)=25.1% * * 预测值 1（实际“会违约”） 0（实际“不会违约”） 1 66 28 0 185 721 ?回应率(response rate)：在预测的名单中找出有多少小概率事件（在预测违约的名单中，真正违约的所占比例是多少）。可以发现，原始回应率为25.1%，运用数据挖掘模型提升为70.21%，因此回应率提升了2.8倍。回应率讲究的是模型“宁缺勿滥”的能力。回应率高并不代表一定是好模型，因为如果利用数据挖掘模型从一万人中挑出10个最有可能会买产品的顾客，结果回应率是100%，但是却漏掉了大多数会买产品的顾客，因此，还得参考“反查率”这个指标。 * * Recall =预测会违约且实际违约/所有实际会违约 =66/(66+185)=26.29% 它的意义在于：预测出来会违约的人占了总体会违约的客户多少百分比。反查率越高，表明犯第二类错误的可能性越小，那么模型越好。 * * 预测值 1（实际“会违约”） 0（实际“不会违约”） 1 66 28 0 185 721 ?反查(recall)：预测出来的小概率事件占总体小概率事

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

7.第八章数据挖掘模型评估.pptVIP