《Python金融数据挖掘》第16章 案例2:网络贷款违约预测.pptxVIP

《Python金融数据挖掘》第16章 案例2:网络贷款违约预测.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《Python金融数据挖掘》 高等教育出版第十六章综合案例2:网络贷款违约预测 【知识框架图】网络借贷违约预测流程 目录Contents第一节案例背景第二节数据概况第三节操作流程 本章学习目标1. 网络贷款违约预测 01案例背景 第一节 案例背景随着互联网应用的日益普及,网络贷款已成为一种常规的贷款形式,渐渐为人们所接受。网络贷款借助互联网的优势,贷款人可以足不出户的完成贷款申请的各项步骤,包括了解各类贷款的申请条件,准备申请材料,一直到递交贷款申请,都可以在互联网上高效地完成。网络贷款可以分为商业机构对客户的B2C(Bank-to- Customer)模式和个人对个人的P2P模式。B2C模式的B一般指银行,有些网站也提供贷款公司的产品。 第一节 案例背景而P2P模式大多生存于互联网、移动端。P2P是英文person-to-person(或peer-to-peer)的缩写,意即个人对个人(伙伴对伙伴)。P2P又称点对点网络借款,是一种将小额资金聚集起来借贷给有资金需 求人群的一种民间小额借贷模式,属于互联网金融(Internet Finance, ITFIN)产品的一种。P2P借贷属于民间小额借贷,是借助互联网、移动互联网技术的网络信贷平台及相关理财行为、金融服务。移动互联网最直接的优点是“便捷、高效、不受地域限制”,近年来,这种不受地域限制的闪电借款模式得到了非常迅猛的发展。 第一节 案例背景为了规范网络借贷过程管理,进一步加强网络借贷风险控制,业界人士开始关注采用一些技术手段来规避网络借贷风险。本章给出的案例是基于人工智能与数据挖掘技术的网络贷款个人用户违约评估策略,其目的是发现高违约群体,降低借贷风险。网络借贷违约预测的基本思路是:综合用户的基本信息、业务信息及信用数据,以历史业务中是否出现过违约为分类标签,利用数据挖掘的分类算法进行模型训练,经过调整优化后,使用训练后的模型对新申请用户的信息进行分类预测,以预测的分类结果作为核发贷款的重要依据。 第一节 案例背景图16-1 网络借贷违约预测流程 第一节 案例背景网络借贷预测流程如图16-1所示。第一步是清洗原始历史业务数据,得到满足算法输入要求的训练数据集,其中各项用户信息和第三方信息作为样本属性,用户历史业务还款状况作为样本分类标签。本章第3节中,结合本案例的实际数据介绍了数据清洗的思路和方法。第二步是选用某种数据挖掘算法进行模型训练。第三步是算法参数调优,可采用Scikit-Learn参数调整算法(详见第13章)。第四步在模型中输入新用户的业务信息和第三方征信数据。第 五步获得预测结果,可作为是否执行贷款业务的重要依据。 02数据概况 第二节 数据概况本案例的数据文件来自世界上最早开展网络贷款的LendingClub公司 (),这是一家会员制的网络借贷公司,于 2006年10月在美国特拉华州成立,2007年5月开始在脸书(Facebook) 上以一个应用的形式运营。随着美国监管机构对P2P借贷行业的监管要求变化,LendingClub的商业模式经历了3个发展阶段:信息中介模式(2007年6月至2007年12月)、类银行模式(2008年1月至2008年3月)以及资产证券化模式(2008年 10月之后)。 第二节 数据概况LendingClub公司: 第二节 数据概况在LendingClub的业务流程中,借款人信用报告是风险控制的一个重要环节。LendingClub采用的是商业银行的风控技术,即基于FICO信用分(FICO是Fair Isaac Company推出的个人信用评分系统,主要用于贷款方快速、客观的度量客户的信用风险,缩短授信过程。其官方网址为:/en),用于核实贷款申请者的收入等要素。 第二节 数据概况根据借款人的FICO得分,每笔申请者被赋予一个基础风险级别,共有 25级。这个基础风险等级和借款人本次申请的期限、金额、还款来源、还款方式等属性一起,由一个评估模型划分为35个贷款等级,有A-G共 7个主等级,每个主等级又细分为5个子级别。作为互联网小贷业务的典型代表,该公司向用户和研究人员开放了大量的经营历史数据,下载地址:/info/download-data.action。本案例中,选择了覆盖2007年年初到2017年第3季度的贷款申请获得者最终的违约情况的数据集,数据集中各字段含义如表16 1所示。此外,在 /developers/listed-loans还可以查看更加详细的数据字段定义和说明。 第二节 数据概况/developers/listed-loans:表16-1 数据字段定义见教材。 03操作流程 第三节 操作流程一、 数据清洗与因素分析程序如下:基础工作包准备阶段,和上一章案例相似,仍然是引入 NumPy、Pandas、Matplotli

文档评论(0)

mini小不懂 + 关注
实名认证
文档贡献者

你不是在修补而是在创造;永远不要忘记你向人们所展示的是你的思想,而不是你的手艺。

1亿VIP精品文档

相关文档