- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络借贷违约风险分析
摘要:以p2p网络借贷为例,从人人贷中选取2015—2018年共7559条记录,通过数据挖掘模型来对借款人违约风险进行分析,并识别出影响借款人违约的主要因素,这些数据挖掘模型主要包括决策树、支持向量机和随机森林。主要结论包括:第一,运用数据挖掘模型来预测违约风险效果都很好,其中最好的是随机森林;第二,特征重要性程度前五依次为信用等级、借款金额、借款周期、借款利率、借款人所在企业的规模。
关键词:p2p网络借贷;数据挖掘;违约风险
中图分类号:f832文献标志码:a文章编号:1673-291x(2020)10-0088-04
引言
近年来,互联网与金融的结合更加广泛,互联网金融凭借其支付优势、流程优势等优势逐渐深入人心,同时也对我国经济的发展起到了很大的促进作用。其中,p2p网络借贷是互联网金融的一个分支。p2p网络借贷,通常是指个体和个体通过互联网平台进行的直接借贷活动。艾瑞咨询统计结果显示,截至2017年,我国网络借贷超过了2万亿元,且年增长率高达40%,用户高达2亿人,相较2016年增长23.1%,可见网络借贷发展之蓬勃。
p2p网络借贷开始出现是在英国,因为其相较于传统银行更加方便,回报率高,很快便快速蔓延至其他国家。2007年6月,我国第一家p2p网贷公司成立,从此网络借贷在我国拉开了序幕。在2013年前,我国p2p网贷平台发展的很慢,属于萌芽期。2013开始,我国p2p网贷行业在用户和平台都开始爆发性增长。但是在爆发性增长的同时也伴随着很多风险,截至2017年,停业的p2p网贷平台已达1500家,网贷平台坏账率普遍达到了10%以上,这显著高于传统金融机构。网贷平台的高风险,有一个主要原因是,网贷不需要抵押,借款人违约成本较低,如果出现很多借款人违约,则会对平台现金流产生影响,会影响平台的可持续发展。在此背景下,对借款者的违约风险进行分析显得尤为重要。
本文主要运用数据挖掘的方法,基于数据借款人信息,找出影响借款人的违约因素,以期能给网贷平台和投资者提供些参考。本文选用的模型相对于传统的风险分析模型主要优势是,传统的模型大多需要设定参数,对前提假设有很严格的限制,如最小二乘模型要求数据必须符合正态分布、序列没有关联且没有噪声。logistic要求自变量不能存在多重共线性,而数据挖掘对数据并无限制。
一、文献综述
由于网络借贷的快速发展,对金融业产生了较大的冲击,因此引起了学术界的广泛关注,中外学者对进行了很多关于网络借贷违约的研究。
从违约风险来看。由于信息不对称使得投资人和网贷平台不能很好地评价借款人违约风险的大小,从而增加了投资者和网贷平台的风险(刘丽丽,2013)。同时由于网贷借款人在借款人并不是抵押借款,违约成本比较低,且贷款用途没有限制,这使得贷款风险显著增加(李渊琦、陈芳,2015)。社会资本的存在能有效降低借款人的違约风险,这些社会资本包括借款列表被推荐的额次数、是否加入小组、增加投资者中朋友的个数等等(缪莲英、陈金龙,2014)。通过使用多元线性回归模型对拍拍贷进行违约风险分析,发现随着年龄的增加违约风险越低(刘鹏翔,2017)。借款人声誉能有效缓解信息不对称,声誉变量包括借款人以往违约次数和借款成功次数为代表,实证得出借款人声誉对违约风险的识别效应,且如果借款人还款能力增加,这种识别能力也会增强(李鑫,2019)。以拍拍贷为例,研究学历在网络借贷上的作用,发现随着学历的上升,借款人逾期的风险越小,且借款成功的概率更高(程瑶,2018)。
就研究模型来看,经典的预测借款人违约的模型,如logistic、probit,ols预测效果有太多的约束,如对样本要求比较严格,在特征较为复杂的情况下,预测效果会大打折扣(hillgriffithsandlim,2011)。相较于经典的预测模型,数据挖掘模型对样本没有较多约束,且能应对更为复杂的自变量,通常情况下,预测效果好于经典预测模型(goyal,a.andr.kaur,2016)。
二、模型选择
本文所选用的数据挖掘模型包括支持向量机(svm)、决策树(dt)和随机森林(rf),这三种模型都是监督学习算法,都是可以通过训练样本获得最优模型的。
(一)支持向量机
支持向量机的目标是创建一个平面边界,称为超平面,从而将具有不同性质的样本进行划分,划分的原则是间隔最大化。支持向量机从20世纪90年代开始快速发展,目前在很多领域都得到广泛应用。支持向量机可以将低维度空间样本分类的问题投影到高维度空间,从而可以在新的空间上得出最优超平面。
目前,支持向量机模型常
文档评论(0)