- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
— PAGE \* Arabic 1 —
信用评分模型的理解和学习
信用评分模型的理解和学习 本文将围绕以下几点进行介绍: ?信用风险 ?信用评分 ?信用评分模型建立的基本流程 信用风险 我们先说一下,风险管理的发展历程,风险管理最早起源于美国。1931年由美国管理协会保险部最先倡导风险管理,后面在全球流行开来,随着互联网的迅猛发展,大数据、数据挖掘和机器学习等新兴技术开始出现,让风险管理更为精准。他们通过收集银行系统本身的征信数据以及用户在互联网上的的各种数据,包括人际关系、历史消费行为、身份特征等,通过大数据“画像”技术,对用户进行全面的定位,由此来预测用户的履约能力、降低信贷风险。 什么是信用风险? 说简单点就是违约风险,是指借款人或交易的对方因种种原因,不愿或无力履行合同条件而构成违约,致使银行、投资者或交易对方遭受损失的可能性。 近年来消费金融一直在迅速增长,比如汽车贷款,住房贷款,信用卡贷款,小额贷款等,增长趋势迅猛,对于可自动化对风险评估非常有必要的,通过对申请人信用评分来降低风险 信用评分 信用评分基本原理是什么呢? 基于对大数据的统计分析,根据客户的资料信息,对客户信用进行评估(打分) 信用的风险评级: 申请者评级: 个人客户申请融资类业务时提交的数据进行评级,(A卡) ?行为评级: 个人客户的历史行为数据进行评级,对客户可能出现的逾期、延期等行为进行预测(B卡) ?催收评级: 对业务中存量客户是否需要催收的预测(C卡) ?欺诈评级: 业务中新客户可能存在的欺诈行为的预测(F卡) ?信用评分卡 以一种分数的手段来衡量风险概率的方式,分数高代表信用越好 根据信用评级的,分为四种评分卡:申请评分卡,行为评分卡,催收评分卡,欺诈评分卡 本文以申请评分卡模型为例 申请人信用评分条件说明 在申请人信用评分中,贷方需要对申请人是否会在未来一段时间12个月内出现90天以上的逾期支付进行评估。 信用评分模型建立的基本流程 ?明确问题 在开发信用风险模型之前,首先要明确我们需要解决的问题,确定是哪类问题,是申请人评分卡模型,还是行为评分卡模型,本文主要以申请评分卡模型,主要目的是区分好坏客户。 ?数据获取 银行自有的数据和第三个机构数据(芝麻信用等) ?数据清洗 缺失值处理: 缺失比较少可以用均值,众数,中位数等填充;也可以用机器学习模型来填充缺失值(常见算法有随机森林,决策树,kNN等),通过算法来拟合数据。 异常值处理: 首先要对异常值进行检测:可以用四分位数(结合可视化,箱线图,散点图等观测数据),基于统计学的方法:例如基于正态分布的一元离群 点检测方法;距离算法:LOF检测,通过对每个点p和其领域点的密度来判断点是否为异常点。 然后处理异常值:删除异常值;视为缺失值,用缺失值的处理方法处理; 平均值来修正;不处理。 异常值和缺失值处理,一定要结合实际情况。 ?数据探索 获得变量数据的分布状况等 ?特征选择 变量选择,对变量离散化,筛选出对目标变量影响最显著的指标 特征选择,在数据中是非常中重要,目的在于帮助我们挑选出最有意义的特征。具体特征选取方法可参考这两篇文章:[机器学习] 特征选择简明指南,结合Scikit-learn介绍几种常用的特征选择方法- 罗兵- 博客园 信用评分模型的变量选择中,一般采用特征分箱的方法对特征进行离散化,让模型更加稳定,再通过woe编码,用通过基尼系数或信息价值 IV找到显著特征项,具体woe和IV学习参考这两篇文章数据挖掘模型中的IV和WOE详解- CSDN博客,Information Value (IV) Weight of Evidence (WOE) - Banking Case Study。 ?模型建立 WOE转化 证据权重WOE转化,将筛选后的变量转为为WOE值,便于信用评分 逻辑回归模型建立 在信用评分卡建模中,用到最常用的方法就是逻辑回归,通过Logistc 回归分析,预测好坏客户的概率。Logistic回归在信用评分卡开发中起到核心作用。由于其特点,以及对自变量进行了证据权重转换(WOE),Logistic回归的结果可以直接转
您可能关注的文档
最近下载
- 水利水电工程单元工程施工质量验收评定表填表说明与示例(样表)2025年版(全).doc VIP
- 人教PEP版(一起)(2024)英语二年级上册英语Unit 3 Helpful hands 教案.docx
- 2025第三届全国技术技能大赛江西选拔赛制造业数字化转型赛项技术方案.pdf VIP
- 实验员考试试题及答案.doc VIP
- 标准起草编制说明范文.pdf VIP
- CRISPR-Cas9基因编辑技术.pptx VIP
- (高清版)B-T 17421.1-2023 机床检验通则 第1部分在无负荷或准静态条件下机床的几何精度.pdf VIP
- 2025年纪检监察应知应会试题库及参考答案.docx VIP
- 球馆充值协议书范本.docx VIP
- 2022年9月17日全国事业单位联考D类《综合应用能力》小学真题及答案.pdf VIP
原创力文档


文档评论(0)