- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘要
随着我国信用经济的快速发展,信贷消费、个人无抵押贷款等业务在各类金
融机构中所占的比例越来越大,信用消费方式在我国经济和人们日常生活中的应
用也得到了极大的提高和扩展。如何均衡消费信贷业务的规模与个人信贷的违约
比率,是目前学术界研究的主要技术性问题之一,也是我国商业银行等各类金融
机构在发展中有待解决的战略性技术问题。而这些技术性问题归根结底就是要如
何解决金融机构个人信贷的配给风险问题。在个人信贷的配给中,最主要的技术
性难题就是如何科学准确的选择个人贷款者,而个人信用风险评估恰好能解决这
一问题。通过对个人基本属性、借贷相关等信息并利用机器学习方法进行研究,
来量化信用风险,从而对解决个人信贷配给问题具有重要的意义。
本文首先选取了 Kaggle 竞赛平台的信用违约预测(Give Me Some Credit)数
据,并对其数据进行了大量的预处理和描述性分析。在本文第四章节中,预处理
过程中依据缺失特征的分布情况选择众数填补了缺失值,并根据箱线图法的判别
结果剔除了特征中的极端异常值,还绘制了特征的相关系数热力图发现逾期笔数
这三个特征之间存在共线性,通过保留重要特征,取另外两个特征比值的方式消
除了共线性的影响。在描述性分析过程中发现大多数特征都存在长拖尾性,于是
对其进行了对数变换,还对特征中存在的稀疏值进行了适当的计数分箱处理。其
次对预处理的数据进行了特征筛选,运用过滤法和嵌入式法分别计算了违约标识
和各特征之间的相关性与重要性,并将两者加权求平均计算出综合得分,依据得
分的折线图,筛选了前 19 个特征,建立了个人信用风险评估的指标体系,并利
用SMOTE 算法对类别存在偏倚的样本数据进行了平衡化处理。
最后采用Logistic 回归、随机森林、ANN 、AdaBoost 以及XGBoost 等机器
学习算法分别构建了单一的个人信用风险评估模型,依据各单一模型的评估指标、
算法局限性和适应性选择了相对较优的5 个单一模型。利用最大投票(Maximum
Voting)法对这5 个模型进行了集成;利用这5 个单一模型评价指标的综合得分,
对各自赋予了不同的权重,进行了加权平均(Weighted Averaging)集成;还利用
Stacking 集成算法将选择的5 个单一模型作为基分类器,元模型选择Logistic 回
I
摘要
归算法对基分类器的输出进行训练。其中还对选择性集成模型的输出利用Scikit-
learn 库中的Pipeline 函数加了一层工作流管道,对输出结果进行了标准化和纠偏
处理。从选择性集成模型之间以及单一模型的比较分析中发现,Stacking 选择性
集成算法对借款人是否违约的判断,在评估指标、稳健性和适应性等方面都有不
错的表现,其中在降低评价指标Logloss 损失值上尤为明显。因此可以得到结论,
Stacking 选择性集成算法集成了各个分类算法的特点达到了博采众长的目的,在
解决个人信用风险评估问题上有较大的应用价值。
关键词:个人信用风险;信贷配给;类不平衡;Stacking;选择性集成算法
II
目录
目录
摘要 I
ABSTRACT III
第一章 绪论1
第一节 研究背景及意义 1
一、研究背景 1
二、研究意义 1
第二节 国内外研究现状2
一、国外对信用风险评估的研究2
二、国内对信用风险评估的研究2
第三节 研究方法与内容3
一、研究方法3
二、研究内容4
第四节 创新点4
一、信用风险评估指标体系的创新4
二、Stacking 选择性集成算法的引入5
第二章 个人信用风险评估概述6
第一节 个人信用风险评估的概念6
一、信用6
二、个人信
您可能关注的文档
最近下载
- 2024年4月 全国高等教育自学考试真题 人员素质测评理论与方法 06090.doc VIP
- 路基挡土墙专项施工方案 - 大模板.docx VIP
- 一种可连续工作的氦气纯化器与纯化方法.pdf VIP
- 抢救药品相关试题(附答案).docx VIP
- 施工现场机械设备检查技术规范 JGJ 160-2016知识培训.pptx
- 2017年版2020年修订普通高中语文课程标准解读与培训课件.pptx VIP
- (人教2024版新教材)英语四年级上册Unit4.2 Part A Let’s learn&Match, act and guess课件.pptx
- 2025届高考散文一轮整体复习:写人叙事类散文——《放牛记》全文详解+课件.pptx VIP
- 热力管道工程质量保证措施和体系.pdf VIP
- 黄帝内经的临床医学理论.PPT VIP
文档评论(0)