- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
消费信贷大数据风控的四大痛点通常来说,消费信贷从业机构在贷前进行.PDF
消费信贷大数据风控的四大痛点
何飞
交通银行金融研究中心高级研究员
通常来说,消费信贷从业机构在贷前进行风控时,主要
依赖两种技术手段:一是构建评分模型,预防信用风险;二
是挖掘欺诈规则,预防欺诈风险。在实际展业过程中,这两
种手段存在以下问题:
就信用风险防控而言,传统信用评分方法在消费信贷中
的实践效果一般。这主要因为:
第一,消费信贷面向的服务群体具有特殊性。相比于传
统的“高精尖”客群,消费信贷从业机构主要面向低收入群
体。由于存在“信贷记录匮乏、信用数据缺失”等问题,这
类群体通常无法达到传统信用评分模型的授信要求。
第二,消费信贷采取的评分流程具有固化性。这与互联
网时代消费信贷服务呈现的“便捷、快速、分散”等特征相
悖。
第三,消费信贷应用的场景环境具有虚拟性。虚拟的消
费场景使得针对个人的授信过程更加复杂,传统信用评分模
型在虚拟场景中的运用效果大打折扣。
就欺诈风险防控而言,人工总结欺诈规则不具有可持续
性。这主要因为:第一,人工经验存在先天性主观偏差。第
二,虚拟环境下欺诈手段变化多端。第三,欺诈事件中团伙
作案现象凸显。
传统技术手段的“失效”,使得大数据风控成为行业热
点。但与此同时,消费信贷大数据风控存在四大痛点:
首先,消费信贷从业机构往往借助多种数据进行信用评
估。一方面,对于能够查询到央行个人征信报告(PBOC 记录)
的群体,其普遍存在 “数据缺失严重、不同属性缺省值差异
大、有效缺省填补方式难寻觅”等问题,这大大影响了从业
机构的授信效率及效果。另一方面,存在信息登记遗漏、错
误、记录不规范等现象,这对从业机构据此评判个人还款能
力及还款意愿构成挑战。通常,我们将数据缺失严重的现象
描述为“数据稀疏性”。传统应对数据稀疏性的方法是将有
关维度直接删除,但由于大数据不仅存在“高维度”的显性
特征(变量个数较多),而且存在“弱相关”的隐性特征(自
变量与因变量之间存在相关性,但相关性不高),直接删除
维度将影响模型评分效果。概言之,如何应对“数据稀疏性”
问题,成为消费信贷大数据风控的痛点之一。
其次,部分消费信贷从业机构已经意识到拓展外部数据
的重要性,但对于拓展哪些数据,还存在较大疑虑。一方面,
基于互补原则,引入社交数据、运营商数据、电商数据、公
共服务数据等外部数据,已成为从业机构的展业方向。但由
于数据种类繁多,究竟哪些数据与消费信贷业务联系紧密,
仍处于探索阶段。另一方面,由于成本限制,消费信贷从业
机构在拓展外部数据时,必定有所选择,如何尽量规避“数
据重复”问题,以及如何对重复数据进行有效处理,都值得
深入思考。除此以外,由于外部数据通常以脱敏后的“标签”
形式呈现,如何根据自身业务提出针对性数据需求,以及如
何通过技术手段对“二手数据”进行有效利用,都是数据拓
展过程中的难题。概言之,如何进行切实有效的外部数据拓
展,成为消费信贷大数据风控的痛点之二。
再次,消费信贷从业机构正积极布局大数据风控系统。
然而,一方面,由于受监管约束较多,商业银行等持牌机构
在开展信用评级过程中,更加注重“可解释、透明性”原则
(这也正是 “逻辑回归”模型被普遍采用的原因)。在此意
义上,大数据技术的“黑箱”特征严重影响其实际应用范畴。
另一方面,当前流行的机器学习算法,如神经网络、随机森
林、支持向量机(SVM)、K-近邻(knn/kknn )、Bagging 、
Boosting 等,在运行过程中,需要依赖强大的软硬件设施。
除此以外,鉴于 “稳定性”是信用评分的重要考量标准,如
何预防机器学习模型普遍存在的 “过拟合”问题,值得深入
探索。概言之,“大数据+机器学习”的有效应用,成为消费
信贷大数据风控的痛点之三。
最后,消费信贷从业机构利用大数据技术预防欺诈风险,
势在必行,但又面临诸多挑战。一方面,由于“地址数据”、
“评价数据”、“社交数据”等都以非结构化形式呈现,故在
借助大数据技术挖掘欺诈规则时,必须进行非结构化数据转
换。在此过程中,从业机构需要采用自然语言处理(NLP )
等方法,而这些方法的正确使用,依赖于丰富的理论指导。
另一方面,欺诈风险防控对软硬件要求较高,传统基于表数
据库的处理方式面临多重考验。除此以外,为了能够实时监
测欺诈风险,构建“Hado
文档评论(0)