基于数据挖掘持卡人信用风险管理探究.docxVIP

下载本文档

2
0
约5.44千字
约 9页
2019-07-17 发布于广东
举报
版权申诉

基于数据挖掘持卡人信用风险管理探究.docx

1、本文档共9页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于数据挖掘持卡人信用风险管理探究摘要：目前的信用卡信用风险研究主要是如何提高模型的预测准确率。针对银行信用卡数据的异质性和信用数据的高度非线性，本文提出了对持卡人信用风险管理的混合数据挖掘方法。该方法包含两个阶段，在聚类阶段，样本数据被聚成同质的类，删除孤立点，不一致样本点重置标签，使样本更具有代表性；在分类阶段，基于样本进行训练生成支持向量机分类器法，对待分样本分类。基于实际数据进行了数值实验，并根据各类样本的特点提出了相应的风险管理策略。关键词：信用风险；风险管理；数据挖掘；聚类；支持向量机中图分类号：F832. 479； TP391文献标识码：A文章编号：1003—7217 (2012) 05—0036—05 一、引言面对国际金融机构的竞争，国内企业和个人的信用有效评估，银行的信贷与项目融资和投资等正面临着巨大的挑战，对信用风险的有效监控和管理已十分迫切。信用评估是政府、金融机构、企业界以及学术界都高度关注的问题。目前的研究都集中于提高信用评分模型的准确率，对持卡人的信用风险管理很少涉及。一般的信用评分模型的出发点是是否接受申请人的申请，把申请人分为“信用好”和 “信用差”两类：把能及时还款的客户归为“信用好”的客户；可能拖欠或违约的归为“信用差”，这些客户的申请将被拒绝［1］。对于信用评分，已有很多研究，如文献［2—7］。 Thomas ［8］和Crook等［9］分别对各种模型进行了总结。由于信用数据的高度非线性和经济形势的影响，分类错误不可避免，信用评分模型准确率的提高空间十分有限［8-10］ o 迟国泰等构建了信用卡信用风险评价指标体系，并确定了划分信用等级的阈值，将根据申请人资料计算出的个人信用综合得分和阈值比较，把客户分为三类：“授予金卡”、“授予普通卡”、“拒绝授予信用卡” ［11］。针对持卡人的信用风险的管理，Hsieh提出了集成数据挖掘模型，把客户分成不同类型，并用关联规则挖掘客户特征与所属类型的关系，为决策提供帮助［12］。由于银行信用卡信用数据的异质性和信用卡数据本身的高度非线性，建立准确率高、鲁棒性强的信用评分模型是一个有挑战性的任务。本文针对信用卡信用数据的特点，提出了两阶段混合数据挖掘方法。该方法在聚类阶段把信用数据聚成同质的类，删去孤立点，不一致点重置标签；在分类阶段用支持向量机进行训练，建立多类支持向量机分类器，把客户分为多组。聚类过程使样本数据的代表性更强，为建立高准确率的分类器奠定基础；分类阶段采用支持向量机方法，这是目前适合小样本数据的最有效方法之一。该方法既可以用于判断是否接受客户的申请，也可以用于信用卡客户的风险管理。判断是否接受客户的申请时，根据事先设定的阈值，把申请人分为相应的类（如授予金卡、授予普通卡和拒绝申请）；对已接受申请的信用卡客户，设定阈值把客户分为几类，实行不同的风险管理措施。二、相关理论基础（一）自组织神经网络自组织特征映射（Self—Organizing Map, SOM）神经网络是无教师学习网络，具有自组织功能。SOM中竞争层神经元通过竞争激活，最终仅有一个神经元作为竞争的胜利者被激活，与该神经元的连接都向对其竞争有利的方向调整。这样，SOM可以很好地模拟大脑的功能区域和神经元兴奋的刺激规律，具有神经元自调节结构和自稳定能力、实现实时学习识别向量空间中最有意义的特征、抗噪音能力强等特点，被广泛地应用于分类、聚类模式识别等。 1. SOM网络的结构。SOM将任意维度的输入转换成一维或二维的离散映射，以拓扑有序的方式实现这个变换。自组织神经网络的输入层和输出层之间全部互连，没有中间层。若输入层有n个神经元，输出层有m2个神经元，输出层的 m2个神经元安排在二维网格中。对给定的输入，通过竞争以若干神经元输出，获胜的神经元g的邻域Ng内的所有神经元都有不同程度的兴奋，而邻域之外的神经元被抑制。这里的邻域一般是对称图形，形状可以任意，但是随时间增大而减小。输入神经元应经历足够的输入次数，确保自组织过程能够实现。财经理论与实践(双月刊)2012年第5期 2012年第5期(总第179期)陈为民，张小勇等：基于数据挖掘的持卡人信用风险管理研究 2. S0M学习过程。对输入向量U, S0M计算它与每个权重向量W的距离(如Euclid距离)，最接近输入向量的神经元me称为最佳匹配单元(best matching unit, BMU),即获胜神经元： II U一me II =min i II U—mi II (1) 确定获胜神经元后，权重向量更新，获胜神经元向输入向量移动。如果 S0M 的输入为 Uk= (ukl, uk2, ???ukn)