- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据在传统贷款风控中应用
大数据在传统贷款风控中应用
摘 要 当前互联网金融高速发展的背景下,在地区性贷款主体中,始终存在无法准确应用大数据提升自身经营发展的现象,制约着自身的业务规模和风控质量。大数据在传统贷款中的应用,重点在于第三方反欺诈准入、信用风险规范、贷中预警管理等方面。除了构建传统信贷模型,还要构建非金融数据的风控模型,多种强弱变量结合进行风险建模,降低变量缺失给模型带来影响,同时最大程度解决传统贷款存在的制约问题。
关键词 传统贷款风控;大数据风控
中图分类号 G2 文献标识码 A 文章编号 1674-6708(2018)204-0119-02
1 传统贷款风控模型缺点
1)传统贷款风控模型基于人行征信数据建立,构建了客户与金融机构间的借贷关系,包括信用额度、逾期记录、还款记录、使用额度比例、坏账记录、记录时间等,其中最为重要的变量是各种还款逾期、不良及坏账的数据。但是金融数据模型中仅有十几项变量,任何变量的缺失,可能都会导致模型失效。
2)截至2015年4月底,人行征信系统已经收录的自然人数达到8.64亿,企业及其他组织数量达到2 068万户,其中有信贷记录的自然人有3.61亿人,有中征码的企业及商户组织有1 023万户,全国仍有近10亿无借贷记录的个人无法进行有效信用评估。
所以,需要通过大数据将消费、日常阅读、娱乐、社交等相对较强或较弱的变量相结合,进行风险建模,延伸征信数据的广度,以及降低部分变量的缺失或失真对模型的稳定性影响。
2 数据来源与存储
2.1 大数据的来源
数据获取的类别包含3类,分别是客户黑名单数据、客户行为数据、客户基本社会特征数据。其中客户黑名单数据包含了客户的风险名单信息、多头借贷信息、黑产信息、黑中介信息、第三方信用评分以及失信被执行和人行征信的数据,客户行为数据通过分析客户的运营商数据、社交数据及消费数据判断客户行为状况,客户基本社会特征数据将通过公开可查询到的社保信息、公积金信息、公检法公开数据等方面获取。
其中在客户黑名单数据获取方面,结合企业自身切实的科技实力,采用对接第三方大数据风控平台及申报对接人行征信系统的方式,快速、全面、集中的查询客户黑名单信息;在客户行为数据方面,可通过运营商、电商数据爬取授权,分析客户的还款能力与消费习惯,同时也以此确定客户的生活圈、真实住址、紧急联系人等数据;在客户基本社会特征数据方面,采用对接已实现爬取不同地区政府公开数据的服务商,快捷满足政府公开数据的收集。
在上述这些数据来源获取和合作的同时,要注意只能通过合规的手段获取数据,并与客户之间建立清晰的权利义务说明,保护客户隐私以及正确使用合作来源的数据。当线上数据获取受限时,通过线下由客户主动提供数据的方式仍是有效的一种,此时尽职调查、外访核实、资料鉴真工作将是重点。
2.2 客户唯一标识与标签化存储
在数据获取之后,如何合理组织客户数据与建立存储模型是大数据存储过程中的关键。该过程中,客户唯一标识、数据整合规则是首先要确定的。一般以客?舻拿?称、证件类型、证件号码的组合为关键识别属性,通过关键识别属性的对比确定唯一客户或者相似客户,之后结合信息覆盖与归并的规则,将客户信息更新与整合。除此之外,黑名单的建立与旧数据标识要同步进行,只有这样才能在数据整合过程中保证客户信息的时效与健全。
当客户数据增长以千的单位时,对客户的标签化分类是精准管理客户的必经阶段。可以通过设置维度的不同分值,系统自动评判部分维度分值,如消费能力、收入、社交偏好、家庭结构等。最终会成总分值,比对模型分值的区间特点预测用户的还款能力与消费需求。
3 实际应用
3.1 反欺诈准入
一旦审批通过恶意欺诈的借款,那么该笔借款的不良逾期风险极高,还款意愿也极低。通常情况下,因为违约成本的存在,以恶意欺诈为出发点的客户,提交的资料不是与自己相关、真实的。并且现在贷款进件中的欺诈行为,往往是多人配合、有计划进行。所以,通过大数据识别恶意欺诈客户,是大数据建立风控模型的重中之重,也是进件准入标准的重要组成部分。
3.1.1 客户唯一标识是反欺诈的前提
因为贷款违约成本的存在,客户填写自身的真实资料,再将欺诈作为目的的借款只占到极少数,毕竟国家在社会信用体系的建设越来越完善,自身的信用重要程度越来越高,没有人会不关心自身的信用状况。所以通过大数据识别出进件信息是借用、伪造他人的信息是先行条件,以此过滤掉绝大多数的欺诈申请。因为客户唯一标识是反欺诈的前提。
3.1.2 客户唯一标识在反欺诈中的运用
客户唯一标识初级的组合是客户名称、证件类型、证件号码的搭配,之后通过实名手机号、银行卡号或人脸数据等其他唯一ID扩展客户唯一标识,丰富
原创力文档


文档评论(0)