大数据背景下网络借贷的信用风险评估以人人贷为例.docx

大数据背景下网络借贷的信用风险评估以人人贷为例.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据背景下网络借贷的信用风险评估 以人人贷为例 柳向东李凤 暨南大学经济学院 摘要: 在大数据时代,网贷平台每天流动着海量交易数据。为充分利用这些数据控制信 用风险,运用数据挖掘算法建立了信用风险评估模型。由于网贷数据多为非平衡 数据,所以通过多次尝试使用SMOTE算法进行处理,提高了模型评估性能。研究发 现:随机森林模型更适合用于信用风险评估,其次是CART、ANN、C4.5o用户的婚 姻、房/车产(贷)等信息重要程度较低,而公司规模、工作吋间等信息,历史借款、 信用评分等信用档案信息在信用风险评估屮尤为重要。 关键词: P2P网络借贷;非平衡数据;SMOTE算法;数据挖掘;随机森林; 作者简介:柳向东,男,湖南浏阳人,理学博士,教授,博士牛导师,研究方向:大数 据理论及统计分析; 作者简介:李凤,女,重庆黔江人,硕士生,研究方向:大数据统计与计量分析。 收稿日期:2015-11-18 基金:国家自然科学基金面上项目《带Ldvy跳的多因子市道轮换框架下的仿射 利率结构模型》 The Evaluation of the Borrower s Credit Risk in Peer一to-Peer Lending under the Background of Big Data:Evidence from RenRen Dai LIU Xiang-dong LI Fen School of Economics, Jinan University; Abstract: Massive transaction data is flowing on the Peer-to-Peer lending platforms every day in the age of big data. For the purpose of making the most of these data to control the credit risk effectively, we established the credit risk evaluation model of Peer-to-Peer lending using data mining methods. Moreover, due to the imbalanee of the data, we decided to use the synthetic mi nori ty over-sampling technique (SMOTE)to improve the performancc of the credit risk model after several trics The empirical study found that Random Forests is more suitable for the evaluation of credit risk. CART, ANN and C4. 5also perform well. In addition, the borrowers marital status and possession of house, car, mortgage and auto loan is of no importemce, but their personal information(company size, cmployment length, etc. )and credit infonuation (loan information, credit score, etc. )play an important role in the evaluation of credit risk. Keyword: Peer-to-Peer lending; imbalaneed data; SMOTE; data mining; remdom forests; Received: 2015-11-18 一、引言 随着互联网的发展和民间借贷的兴起,P2P网络借贷作为一种依托于互联网的新 型金融模式开始兴起并迅速发展壮大。互联网金融平台利用搜索引擎、社交平台、 云计算等,搜集和记录数据,基于这些数据,运用数据挖掘技术可以提高金融风险 监控能力。用户信息、历史交易数据等的收集和记录,促进了资金供求双方的信 息交流,在一定程度上降低了由于信息不对称等带来的金融风险。然而,由于中国 P2P网络借贷起步较晚,信用体系不完善,相关法律法规缺失,平台跑路和借款人 不按时还款其至携款潜逃等问题仍时有发生,暴露出了较为严重的资金安全问 题。另一方而,步入大数据时代,P2P网络借贷平台每日产生的交易数据数量大, 包含的借贷信息多样,更新

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档