基于决策树与随机森林的个人网络贷款违约行为研究.pdfVIP

  • 98
  • 0
  • 约10.89万字
  • 约 73页
  • 2020-08-11 发布于江苏
  • 举报

基于决策树与随机森林的个人网络贷款违约行为研究.pdf

摘要 近年来,“互联网+ ”的概念得到大力推广,互联网金融行业得到迅速发展, 成为最重要的创新项目之一。从支付平台的兴起到网络平台贷款产品的推出,传 统的金融行业遭受到来自互联网与金融相结合的巨大冲击。再加上限贷限购的政 策的影响,各传统商业银行亦纷纷推出自家的网络信用贷款产品。但网络借贷平 台的发展依旧受到不断涌现的借款人违约行为的影响,且在国内的这些平台中, 绝大部分对于借款人的审核以及信用评估机制都较为单一,无法有效避免借款人 的违约行为的产生,对借款人的信用管理还有待加强。与之相对的是,美国的个 人信贷市场发展完善,Lending Club 作为其中的代表堪称世界上最为成功的网络 借贷平台。因此,本文通过分类模型,结合LC 数据,构建了借款人违约行为模 型,从而研究借款人在网络借贷平台中存在的违约行为的影响因素。 本文在研究借款人违约行为的影响因素的过程中,选取了Lending Club 平台 2019 年第一季度的借款人数据展开研究。结合数据产生的过程和属性本身的意 义,对于原始数据141 个有用属性进行了属性类别划分,接着使用层次聚类法和 主成分分析法对维数较高的借款人信用属性进行特征降维和特征选择,对于降维 后的数据使用决策树算法和随机森林算法分别构建分类模型。在对模型进行比较 和分析的过程中,发现了随机森林算法在处理不平衡数据的分类预测时的优越性, 同时总结出了借款人违约行为的影响因素,对网络借贷平台的审核提出建议,并 为信贷数据的分类研究提供了新的思路。 研究表明借款人以往的信用属性对于借款人违约行为的产生是非常重要的 影响因素,包括借款人账户可使用余额、账户最大余额、借款人贷款总额等属性 在内的借款人信用信息,是判断借款人是否会做出违约行为的重要指标。重要程 度仅次于信用属性的是借款人自然信息,包括借款人所在地区和借款人年收入。 另外,借款人是否存在联合申请贷款并不能帮助判断借款人是否会产生违约行为。 因此,在审核阶段加强对借款人信用数据的核验能有效避免违约行为的产生。 关键词:随机森林;决策树;网络贷款;属性划分 Abstract In recent years, the concept of “Internet Plus” has been vigorously promoted, and the Internet financial industry has developed rapidly, becoming one of the most important innovation projects. From the rise of payment platforms to the online sales of products such as funds, wealth management, and insurance, followed by the launch of personal credit loans and online platform loans, Internet finance has had a huge impact on traditional financial institutions. In addition to the impact of the purchase and loan restriction policies, traditional commercial banks have also launched their own online credit loan products. The environment of Chinas online lending industry has gradually improved under national supervision, but a large number of defaults by borrowers are still important factors affecting the development of the online lending industry, and the credit assessment me

文档评论(0)

1亿VIP精品文档

相关文档