住房信贷逾期违约风险新探.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 1 住房信贷逾期违约风险新探   【摘要】银行在住房信贷违约风险评估的现有操作中,主要采用评分卡方式。而评分卡方式通过使用一个全国通用的模型计算某一区域内贷款客户违约的可能性。这一模式的缺陷在于未考虑到地区之间的差异性。本文试图借用当地样本,通过数理统计的方法——边缘概率和数据挖掘的方法来分析购房客户的逾期概率,从而弥补现有评分卡模型的缺陷,成为总行系统评分卡的有效补充。与此同时,该方法也将为各分支行信贷决策时提供更为详细地数据支持,有利于银行全面风险管理的实施。   【关键词】住房信贷;逾期违约风险   在银行受理房贷客户时,都要将客户各项基本信息输入系统,然后系统通过计算得出一张评分卡,上面将显示客户的综合得分以及逾期概率。客户经理和审批人依据评分卡和其他信息,综合考虑决定是否贷款给客户。但在实际工作中,却发现实际逾期频率和评分卡的结果差异不小。究其原因,至少有两点:第一点,用频率衡量概率本来的误差。第二点——也是最重要的一点:银行的模型参数,都是通过全国范围的原始数据得到。但是客户都有地方性差异。用全国的样本所得参数去衡量地方样本,必有很大误差。且银行模型都属商业机密,且相对较复杂。鉴于此,本文将提供两种方法—边缘概率密度方法和数据挖掘方法,帮助分支行用本土数据自己分析当地客户的逾期情况,作为对总行系统评分卡的补充。其中,边缘概率方法较为粗糙;而数据挖掘方法则较为精细,具体又分为支持向量机方法和决策树方法。其中,支持向量机方法直接对违约概率进行分析,而决策树方法则探讨了不同因素对于违约概率的影响。本文首先利用边缘概率方法分析逾期违约概率;然后利用数据挖掘的方法进行分析;最后,文章提出实施新方法的一些操作建议。   一、边缘概率方法   1.模型设定、数据来源及方法   本文将逾期违约概率定义为由概率的统计定义“频率收敛于概率”知,可用“逾期次数/贷款期”来来度量(此贷款期是指发放贷款日到数据观察日的时长,并且按月计算,下同)。而逾期违约概率受行业、项目种类、学历以及婚姻状况等因素影响。因此,在此详细分析这些因素对逾期违约概率的影响。自变量为:行业、项目种类、学历、婚姻状况;因变量为:逾期违约概率。数据来源于国有银行某支行调研数据(数据见附件)通过数据透视表和进一步的数据处理,可以得到如下分析结果   2.分析结果   (1)行业   (2)项目种类   (3)学历   (4)婚姻状况   (5)家庭收入   从家庭收入的角度看,收入越高,逾期的概率越低。但是家庭总收入进入到4000-6000元以后,随着收入的增加,逾期概率的减少幅度不再明显。关注的分界点在4000元左右。也就是说家庭收入在4000元以下的客户,逾期概率概率较大,应重点提防,尤其是2000元以下的客户。   数据挖掘方法:   数据挖掘一般是指从大量数据之中通过一定的方法寻找到其中所包含的特殊性关系的信息的过程。在此,我们运用两种数据挖掘的方法来对放贷客户的违约概率进行分析。   二、支持向量机方法   支持向量机方法是新近发展出来的神经网络技术。它是建立在统计学习理论的Vapnik-ChervonenkisDimension理论和结构风险最小原理基础之上,根据有限样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的推广能力,能较好解决小样本、非线性、高维数和等实际问题。在许多领域都有比较较好的运用。   首先找到实际逾期违约概率的分布;然后再将有效样本分为训练集和测试集。其中,训练集的有效样本占2/3,预测集的有效样本占1/3。通过对训练集的考察可以保证测试集分析在某一水平下的合理性。下面具体分析:   有效统计样本8791个,均来自某银行内部数据。通过简单统计发现,在8442个样本中,未违约的样本数为5875,占比为违约比例为66.83%,违约占比为33.17%;单个样本违约最大逾期违约概率97%;整体而言,单个样本平均逾期违约概率为4.66%;在违约的2916个样本中,平均逾期违约概率为14.05%。   (1)训练集样本的逾期违约概率:   利用R语言编程计算违约概率,排序后得到下图:   (2)训练集的训练效果检验   检验发现,最大值为8.38%,最小值为0.22%,平均值为1.79%,中位数为1.27%。这说明,训练集样本的逾期违约概率预测误差为0.0504,即根据支持向量机的逾期违约概率与实际逾期违约概率相差5.04%。相对于整个样本平均逾期违约4.66%而言,误差略偏大;但相对于那些显著高于10%以上的逾期违约概率人群而言,该值并不算高。   (3)测试集样本的逾期违约概率:   (4)测试集的效果检验   误差检验显示测试集样本的逾期违约概率预测误差为0.0551,即根据支持向量机的逾期违约概率与

文档评论(0)

gmomo-lt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档