- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据背景下网络借贷的信用风险评估——以人人贷为例.DOC
大数据背景下网络借贷的信用风险评估
以人人贷为例
柳向东李凤
暨南大学经济学院
在大数据时代,网贷平台每天流动着海量交易数据。为充分利用这些数据控制信 用风险,运用数据挖掘算法建立了信用风险评估模型。由于网贷数据多为非平衡 数据,所以通过多次尝试使用SMOTE算法进行处理,提高了模型评估性能。研究发 现:随机森林模型更适合用于信用风险评估,其次是CART、ANN、C4.5。用广的婚 姻、房/车产(贷)等信息重要程度较低,而公司规模、工作吋间等信息,历史借款、 信用评分等信用档案信息在信用风险评估屮尤为重要。
关键词:
P2P网络借贷;非平衡数据;SMOTE算法;数据挖掘;随机森林;
基金:国家自然科学基金面上项目《带L6vy跳的多因子市道轮换框架下的仿射 利率结构模型》
The Evaluation of the Borrower’s Credit Risk in Peer-to-Peer Lending under the Background of Big Data:Evidence from RenRen Dai
LIU Xiang—dong LI Fen
School of Economics,Jinan University;
Abstract:
Massive transaction data is flowing on the Peer-to-Peer lending platforms every day in the age of big data. For the purpose of making the most of these data to control the credit risk effectively, we established the credit risk evaluation model of Peer-to-Peer lending using data mining methods. Moreover, due to the imbalance of the data, we decided to use the synthetic minority over-sampling technique (SMOTE)to improve the performance of the credit risk model after several tries. The empirical study found that Random Forests is more suitable for the evaluation of credit risk. CART, ANN and C4. 5also perform well. In addition, the borrower’s marital status and possession of house, car, mortgage and auto loan is of no importance, but their personal information(company size, employment length, etc.)and credit information (loan
information, credit score, etc.)play an important role in the evaluation of credit risk.
Keyword:
Peer-to-Peer lending; imbalanced data; SMOTE; data mining; random forests;
一、引言
随着互联网的发展和民间借贷的兴起,P2P网络借贷作为一种依托于互联网的新 型金融模式开始兴起并迅速发展壮大。互联网金融平台利用搜索引擎、社交平台、 云计算等,搜集和记泶数据,基于这些数据,运用数据挖掘技术可以提高金融风险 监控能力。用户信息、历史交易数据等的收集和记录,促进了资金供求双方的信 息交流,在一定程度上降低了由于信息不对称等带来的金融风险。然而,由于中国 P2P网络借贷起步较晚,信用体系不完善,相关法律法规缺失,平台跑路和借款人 不按时还款其至携款潜逃等问题仍时有发生,暴露出/较为严重的资金安全问 题。男一方而,步入大数据时代,P2P网络借贷平台每日产生的交易数据数量大, 包含的借贷信息多样,更新速度快,如何及时、合理、有效地利用这些数据获取有 用信息,提高平台的风险监控能力至关重要。由此,利用平台的海量交易数据,采 用数据挖掘技术,建立信用风险评估模型,为P2P网络借贷平台监管、投资者选择 投标项目提供依据,具有重要的现实意义。
目前,国外在P2P网络借
您可能关注的文档
最近下载
- 广州市萝岗区凤凰山隧道工程TJ-04合同段 路基高边坡施工“12.29”坍塌 较大事故调查报告.doc VIP
- 新解读《GB_T 18319 - 2019纺织品 光蓄热性能试验方法》最新解读.pptx VIP
- T∕CABEE 030-2022民用建筑直流配电设计标准.pdf VIP
- 高中政治大单元教学设计案例.docx VIP
- 人音版音乐四年级下册 第4课童年的音乐 白桦林好地方 课件(共22张PPT)(含音频+视频).pptx VIP
- 2025年中国方便粉丝市场调查研究报告.docx
- 畜牧养殖业项目融资方案.docx VIP
- 煤矿职业健康操作规程.pdf VIP
- 中建给排水设计控制要点技术指南(94页).pdf VIP
- 2025年青海省中考生物地理合卷试题(含答案解析).docx
文档评论(0)