KS值计算方法分析和总结.docx

KS 和 AR 值计算逻辑 计算模型的 KS 和 AR 指标必须含有模型坏账率的实际值和预测值。其中,实际值为二元变量(1/0)。预测值代表预测的坏账率,通常为分数值(我行零售评分卡分值越高表示坏账率越低,以下指标计算逻辑默认此种代表方式) 计算 KS 指标逻辑如下: 将所有样本根据分数值从低到高排序(即坏账率从高到低)均分成 20 组,分别计算 20 组的实际好样本数、坏样本数、累积好样本数、累积坏样本数、累积好样本数占比、累积坏样本数占比,差值。其中实际好坏样本数分别为改组内的好坏样本数,累积好坏样本数为该组累积的好坏样本数,累积好坏样本数占比为累积好坏样本数占总好坏样本数的比值,差值为累积坏样本数占比减去累计好样本数占比。KS 指标为差值绝对值的最大值。计算示例如下: 组别 实际好样本数 实际坏样本数 累积好样本数 累积坏样本数 累计好样本数占比 累积坏样本数占比 差值 0 0 0 0 0 0 0 0 1 1800 200 1800 200 0.050704 0.4 0.349296 2 1900 100 3700 300 0.104225 0.6 0.495775 3 … 20 1997 3 35500 500 1 1 0 总体 35500 500 KS= 计算 AR 值逻辑与KS 值类似,以累计好样本数、累积坏样本数分别为曲线坐标的 x、y 值,首先计算该曲线与 x 轴围成的面积AUC。第i 组梯形面积计算公式为 (yi+y(i-1))*(xi-x(i-1))/2 201997 20 1997 3 35500 500 1(x20) 1(y20) AUC= 总体 35500 500 AR= 组别 实际好样本数 实际坏样本数 累积好样本数 累积坏样本数 累计好样本数占比(x) 累积坏样本数占比(y) 梯形面积 0 0 0 0 0 0(x0) 0(y0) 0 1 1800 200 1800 200 0.050704(x1) 0.4(y1) 0.0101408 2 1900 100 3700 300 0.104225(x2) 0.6(y2) 0.0267606 3 …

文档评论(0)

1亿VIP精品文档

相关文档