7.第八章数据挖掘模型评估.pptVIP

  • 45
  • 0
  • 约5.68千字
  • 约 42页
  • 2017-05-21 发布于四川
  • 举报
Response rate =预测会违约且实际会违约/所有预测会违约 =66/(66+28)=70.21% 预测模型回应率的高低须和总体回应率比较: 总体response rate =总体实际会违约/总体=(66+185)/(66+185+28+721)=25.1% * * 预测值 1(实际“会违约”) 0(实际“不会违约”) 1 66 28 0 185 721 ?回应率(response rate):在预测的名单中找出有多少小概率事件(在预测违约的名单中,真正违约的所占比例是多少)。 可以发现,原始回应率为25.1%,运用数据挖掘模型提升为70.21%,因此回应率提升了2.8倍。 回应率讲究的是模型“宁缺勿滥”的能力。 回应率高并不代表一定是好模型,因为如果利用数据挖掘模型从一万人中挑出10个最有可能会买产品的顾客,结果回应率是100%,但是却漏掉了大多数会买产品的顾客,因此,还得参考“反查率”这个指标。 * * Recall =预测会违约且实际违约/所有实际会违约 =66/(66+185)=26.29% 它的意义在于:预测出来会违约的人占了总体会违约的客户多少百分比。反查率越高,表明犯第二类错误的可能性越小,那么模型越好。 * * 预测值 1(实际“会违约”) 0(实际“不会违约”) 1 66 28 0 185 721 ?反查(recall):预测出来的小概率事件占总体小概率事

文档评论(0)

1亿VIP精品文档

相关文档