KS 和 AR 值计算逻辑
计算模型的 KS 和 AR 指标必须含有模型坏账率的实际值和预测值。其中,实际值为二元变量(1/0)。预测值代表预测的坏账率,通常为分数值(我行零售评分卡分值越高表示坏账率越低,以下指标计算逻辑默认此种代表方式)
计算 KS 指标逻辑如下:
将所有样本根据分数值从低到高排序(即坏账率从高到低)均分成 20 组,分别计算 20 组的实际好样本数、坏样本数、累积好样本数、累积坏样本数、累积好样本数占比、累积坏样本数占比,差值。其中实际好坏样本数分别为改组内的好坏样本数,累积好坏样本数为该组累积的好坏样本数,累积好坏样本数占比为累积好坏样本数占总好坏样本数的比值,差值为累积坏样本数占比减去累计好样本数占比。KS 指标为差值绝对值的最大值。计算示例如下:
组别
实际好样本数
实际坏样本数
累积好样本数
累积坏样本数
累计好样本数占比
累积坏样本数占比
差值
0
0
0
0
0
0
0
0
1
1800
200
1800
200
0.050704
0.4
0.349296
2
1900
100
3700
300
0.104225
0.6
0.495775
3
…
20
1997
3
35500
500
1
1
0
总体
35500
500
KS=
计算 AR 值逻辑与KS 值类似,以累计好样本数、累积坏样本数分别为曲线坐标的 x、y 值,首先计算该曲线与 x 轴围成的面积AUC。第i 组梯形面积计算公式为
(yi+y(i-1))*(xi-x(i-1))/2
201997
20
1997
3
35500
500
1(x20)
1(y20)
AUC=
总体
35500
500
AR=
组别
实际好样本数
实际坏样本数
累积好样本数
累积坏样本数
累计好样本数占比(x)
累积坏样本数占比(y)
梯形面积
0
0
0
0
0
0(x0)
0(y0)
0
1
1800
200
1800
200
0.050704(x1)
0.4(y1)
0.0101408
2
1900
100
3700
300
0.104225(x2)
0.6(y2)
0.0267606
3
…
您可能关注的文档
- 2020年高考语文一轮总复习《古代诗歌阅读》重九夜偶成.docx
- 2020年高考语文一轮总复习《古代诗歌阅读表达方式》虚实结合.docx
- 2020年高考语文一轮总复习《古代诗歌阅读表达方式》用典抒情.docx
- 2020年高考语文一轮总复习《古代诗歌阅读表达方式》正侧结合.docx
- kfc社会实践心得体会范文五篇.docx
- KHCS22C型装置分析和总结.docx
- KHCS型系列双机双通道切换装置.docx
- KHTD型系列MODEM说明书.docx
- KL变换分析和总结.docx
- KMEANS算法分析和总结.docx
- 2025年全国演出经纪人员资格认定考试试卷带答案(研优卷).docx
- 2025年全国演出经纪人员资格认定考试试卷完整版.docx
- 2025年全国演出经纪人员资格认定考试试题库及完整答案.docx
- 2025年全国演出经纪人员资格认定考试试卷完美版.docx
- 2025年全国演出经纪人员资格认定考试试卷含答案(实用).docx
- 2025年全国演出经纪人员资格认定考试试卷及答案(各地真题).docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
- 2025年全国演出经纪人员资格认定考试试卷及答案1套.docx
- 2025年下半年四川成都市郫都区面向社会引进公共类事业单位人员2人备考题库最新.docx
- 2025年下半年内江市部分事业单位公开考试招聘工作人员(240人)备考题库附答案.docx
原创力文档

文档评论(0)