- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
-130-学技术创新2024.06
基于机器学习的信用卡逾期预测研究
卢荣伟,黄嫦娥*,谢久暉*
(桂林电子科技大学数学与计算学学院,广西桂林)
摘要:银行等信贷机构希望利用客户的信用数据构建模型对目标客户的逾期行为进行预测,将预测为
“未逾期”的客户作为重点发展客户。针对传统机器学习模型预测为“未逾期”客户的可信度不高问题,文章构建
了基于PR曲线的随机森林模型。在数据预处理,使用独热编码对类别数据进行量化处理,并使用SMOTE方
法对样本数据作平衡化处理。然后,基于PR曲线选择最优特征数以及使得分最大的最佳阈值0.182,构建随机
森林模型,并通过网格搜索法进行超参数调优。实证结果表明:文章所提出模型的召回率为0.854、可信度为
0.918,相对传统机器学习模型的预测效果有显著提升,更有利于银行对客户进行批量评估以及筛选优质客户。
关键词:逾期预测;机器学习;PR曲线;随机森林
中图分类号TP181;F272.1文献标识码A文章编号2096-4390渊2024冤06-0130-04
引言1.1ROC曲线与PR曲线
随着互联网和移动支付的快速发展,信用卡已经ROC(ReceiverOperatingCharacteristic)曲线是描
成为了人们日常生活中必不可少的支付手段之一。准述二元分类器在不同阈值下的表现的曲线。PR
确预测逾期风险可以帮助银行更好地管控风险,减少(Precision-Recall)曲线是弥补了ROC曲线在处理不平
损失。客户的信用卡信息和个人消费数据往往与其违衡数据时出现缺陷而诞生的一种评估指标。横轴表示
约行为有着某种联系。借助机器学习方法来学习这种召回率(recall),纵轴表示精确率(precision)。PR曲线显
“联系”,从而对大规模客户进行信用评价是可行的。示了在不同阈值下,精确率和召回率之间的折中关
已有的研究表明,机器学习算法在信用卡逾期预测问系。曲线上每个点代表一个不同的阈值,需要根据实
[1]际需求来选择合适的阈值。如果更加关注查准率,则
题上具有更高的效率和准确性。RSingh1.1.1在信用
评分问题中,对传统的统计和现代数据挖掘、机器学应该选择PR曲线上靠较左侧的点作为最佳阈值;如
习工具进行了评估,其对比了线性判别分析、支持向果更加关注查全率,则应该选择PR曲线上靠较右侧
[2]
量机核密度估计、逻辑回归、遗传算法、邻近算法等技的点作为最佳阈值。
术,结果表明,支持向量机和遗传算法在分类信用卡1.2评价指标
[3]
申请人误判率上较其他技术优。然而,已有的研究混淆矩阵是机器学习中用于评估分类模型性能
中,很少基于本文针对传统机器学习模型预测为“未的一种方法。它是一个二维数组,横轴表示实际的类
逾期”客户的可信度不高问题,对传统的机器学习模别,纵轴表示预测的类别,每个元素表示将实际类别
型进行改进,降低将“逾期”客户预测成“未逾期”客户预测为某个类别的样本数目,见表1。
的概率,使得模型预测结果有较高的可信度,从而为表1混淆矩阵
银行实现信用卡精准销售,优化客户资源,降低信用真实值预测值
01
违约风险的目的。0TrueNegative(TN)FalsePositive(FP)
1
初级会计持证人
专注于经营管理类文案的拟写、润色等,本人已有10余年相关工作经验,具有扎实的文案功底,尤善于各种框架类PPT文案,并收集有数百万份各层级、各领域规范类文件。欢迎大家咨询!
文档评论(0)