- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
?
?
贝叶斯算法在小额信贷风险管理中的应用研究
?
?
张宇敬+吴红乐+安英博
摘要:文章选取贝叶斯算法对影响小额信贷风险的因素进行挖掘分析,建立了客户信用风险评估模型,确定了财产、收入负债比、信用记录等属性是影响小额信贷风险的主要因素,根据模型规则能够比较快速准确地判断客户信用等级,从而有效地控制和降低信贷风险的发生。
关键词:小额贷款;贝叶斯算法;风险管理
一、引言
现代互联网技术的飞速发展,标志着人类社会继农业革命、工业革命之后的“第三次革命”的到来。时代在改变,旧的生产关系和生活方式必将被历史的车轮碾过,成为人类社会发展道路上的尘埃,新的生产关系和产业生态正在蓬勃发展。在今天这个大数据的时代,借助现代信息技术和互联网,人类可以收集、整理和分析海量的信息和数据,在这些纷繁复杂的数据背后探寻人类行为和社会发展的轨迹。面对新的行业生态和环境,金融行业必然要寻求改变,才能顺应时代。数据挖掘是指从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程,将数据挖掘技术有效地应用于银行业是技术发展的热点,也是银行业自身竞争发展的迫切需要。
小额贷款从贷款额度上讲,属于小金额。它从贫困人口的实际出发,绝大多数人从事的是种养业或是一些风险小、易操作、见效快的小型项目。从贷款对象上看,主要是微型企业和低收入的家庭和个人。贷款用途一般是小规模农业生产,主要用作生产资本,也有一小部分用于教育、医疗等非生产性目的。与传统银行业务面临的风险相比,小额贷款的风险具有一定的独特性,一般按参与活动的主体,将风险分为:环境风险、信用风险和管理风险三大类,其中主要还是信用风险。信用风险是指借款人不能及时还本付息的风险。小额贷款活动的借方,一般是缺乏完整和正规教育的农民,他们往往缺少经济体系中的“欠债还钱”和“按照合同办事”的信用观念,会导致信用风险的产生,使得信贷资金存在严重的风险隐患,并且信贷管理中存在着诸多问题,面临着一些难以掌控的风险。因此,运用数据挖掘技术来控制信贷中的风险,是信贷管理面临的重要课题。
二、数据分析
数据分析是数据挖掘前十分重要的一个步骤,正确的数据分析有利于提高挖掘模型的准确性,达到更好的模型预测效果。课题组分析的是村镇银行个人贷款数据,将一些涉及个人隐私的属性和无关属性剔除后,发现该数据既包含连续型的数据,又有离散型的数据,且连续型的数据较多。通过RStudio数据分析工具进行相关性分析后发现,各个属性之间相关性较低,即各属性之间可以近似看成是相互独立的。综合考虑,该数据比较适合采用贝叶斯算法建立分类模型,帮助银行规避贷款风险。
三、贝叶斯算法
朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法,它是一种简单有效的常用分类算法。朴素贝叶斯分类的定义如下:
四、构建贷款风险分析模型
在建立贝叶斯分类模型前,首先应完成数据预处理工作,它是建立科学合理的挖掘模型的基础。贝叶斯分类模型要求数据必须是离散的,因此课题组将原始数据中年龄、健康状况、个人品质、银行信用记录等属性离散化,建立贷款风险评价指标,并据此对样本数据进行数字化处理。应用贝叶斯分类模型时,还应注意零概率事件的处理,如果存在零概率事件,将直接影响预测结果。因此,进行挖掘之前,需要对零概率事件进行检验,一般采用Laplace-估计进行处理。具体处理方法如下:P(Xi|Xi)=nc+mpn+m。通过查询发现以下属性的属性值存在零概率事件,通过SQL语句(select属性fromshujuorderby属性)查询并利用属性的中位数来填补缺失值。
将处理好的数据导入到SQLServer数据库后,即可商业智能分析工具进行数据挖掘。课题组随机抽取80%的数据作为训练数据集,剩下的20%作为测试数据集,通过商业智能分析工具获得各个属性与风险等级之间的依赖关系由弱到强依次是:身体借款用途生产经营家庭收入个人品质信用记录收入负债比财产。由此可见,当贷款人财产属性值越高,即收入越高,其贷款风险越低。同理可得,当贷款人的年龄越小,收入越高,家庭成员身体越健康,信用越好,负债越少,生产经营越稳定等,贷款的风险越低,反之,产生不良贷款的可能性越高。
五、模型评价
由测试数据预测的分类矩阵可知,该模型判别的正确率为80/92≈86.96%,具有较高的准确率和预测能力,能够满足农户小额信贷风险评估的实际需求,为小额信贷公司、村镇银行信贷部门防范风险提供科学的决策依据。(作者单位:河北金融学院)
基金项目:2015年保定市哲学社会科学规划课题(201505052);保定市科学技术研究与发展指导计划项目(15ZG003);河北省教育厅科技重点课题(Z
参考文献:
[1]安英博张宇敬张建男.基于朴素贝叶斯的村镇银行信用风险预警研究[J].无线互联科技
您可能关注的文档
- 超大竖井井壁灌浆施工同步提升系统设计安装施工研究.docx
- 资产证券化中风险隔离机制在我国的运用.docx
- 2023年辽宁省鞍山市中考生物一模试卷+答案解析.pdf
- 2023年江苏省盐城市建湖县海南中学中考数学仿真试卷+答案解析.pdf
- 2023年江苏省苏州市中考数学考前模拟预测卷+答案解析.pdf
- 2023年江苏省苏州中学园区校中考数学二模试卷+答案解析.pdf
- 2023年江苏省苏州十六中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市海门区中考数学一模试卷+答案解析.pdf
- 企业IT管理详述_全.pdf
- 2023年江苏省南通市通州区等2地中考一模数学试卷+答案解析.pdf
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)