- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘持卡人信用风险管理研究
基于数据挖掘持卡人信用风险管理研究
摘 要:目前的信用卡信用风险研究主要是如何提高模型的预测准确率。针对银行信用卡数据的异质性和信用数据的高度非线性,本文提出了对持卡人信用风险管理的混合数据挖掘方法。该方法包含两个阶段,在聚类阶段,样本数据被聚成同质的类,删除孤立点,不一致样本点重置标签,使样本更具有代表性;在分类阶段,基于样本进行训练生成支持向量机分类器法,对待分样本分类。基于实际数据进行了数值实验,并根据各类样本的特点提出了相应的风险管理策略。
关键词: 信用风险;风险管理;数据挖掘;聚类;支持向量机
中图分类号:F832.479;TP391 文献标识码: A 文章编号:1003—7217(2012)05—0036—05
一、 引 言
面对国际金融机构的竞争,国内企业和个人的信用有效评估,银行的信贷与项目融资和投资等正面临着巨大的挑战,对信用风险的有效监控和管理已十分迫切。信用评估是政府、金融机构、企业界以及学术界都高度关注的问题。
目前的研究都集中于提高信用评分模型的准确率,对持卡人的信用风险管理很少涉及。一般的信用评分模型的出发点是是否接受申请人的申请,把申请人分为“信用好”和“信用差”两类:把能及时还款的客户归为“信用好”的客户;可能拖欠或违约的归为“信用差”,这些客户的申请将被拒绝[1]。对于信用评分,已有很多研究,如文献[2—7]。
Thomas[8]和Crook等[9]分别对各种模型进行了总结。由于信用数据的高度非线性和经济形势的影响,分类错误不可避免,信用评分模型准确率的提高空间十分有限[8—10]。迟国泰等构建了信用卡信用风险评价指标体系,并确定了划分信用等级的阈值,将根据申请人资料计算出的个人信用综合得分和阈值比较,把客户分为三类:“授予金卡”、“授予普通卡”、“拒绝授予信用卡”[11]。针对持卡人的信用风险的管理,Hsieh提出了集成数据挖掘模型,把客户分成不同类型,并用关联规则挖掘客户特征与所属类型的关系,为决策提供帮助[12]。
由于银行信用卡信用数据的异质性和信用卡数据本身的高度非线性,建立准确率高、鲁棒性强的信用评分模型是一??有挑战性的任务。本文针对信用卡信用数据的特点,提出了两阶段混合数据挖掘方法。该方法在聚类阶段把信用数据聚成同质的类,删去孤立点,不一致点重置标签;在分类阶段用支持向量机进行训练,建立多类支持向量机分类器,把客户分为多组。聚类过程使样本数据的代表性更强,为建立高准确率的分类器奠定基础;分类阶段采用支持向量机方法,这是目前适合小样本数据的最有效方法之一。该方法既可以用于判断是否接受客户的申请,也可以用于信用卡客户的风险管理。判断是否接受客户的申请时,根据事先设定的阈值,把申请人分为相应的类(如授予金卡、授予普通卡和拒绝申请);对已接受申请的信用卡客户,设定阈值把客户分为几类,实行不同的风险管理措施。二、相关理论基础(一) 自组织神经网络
自组织特征映射(Self—Organizing Map, SOM)神经网络是无教师学习网络,具有自组织功能。SOM中竞争层神经元通过竞争激活,最终仅有一个神经元作为竞争的胜利者被激活,与该神经元的连接都向对其竞争有利的方向调整。这样,SOM可以很好地模拟大脑的功能区域和神经元兴奋的刺激规律,具有神经元自调节结构和自稳定能力、实现实时学习识别向量空间中最有意义的特征、抗噪音能力强等特点,被广泛地应用于分类、聚类模式识别等。
1. SOM 网络的结构。SOM将任意维度的输入转换成一维或二维的离散映射,以拓扑有序的方式实现这个变换。自组织神经网络的输入层和输出层之间全部互连,没有中间层。若输入层有n个神经元,输出层有m2个神经元,输出层的m2个神经元安排在二维网格中。对给定的输入,通过竞争以若干神经元输出,获胜的神经元g的邻域Ng内的所有神经元都有不同程度的兴奋,而邻域之外的神经元被抑制。这里的邻域一般是对称图形,形状可以任意,但是随时间增大而减小。输入神经元应经历足够的输入次数,确保自组织过程能够实现。
财经理论与实践(双月刊) 2012年第5期
2012年第5期(总第179期) 陈为民,张小勇等:基于数据挖掘的持卡人信用风险管理研究
2. SOM 学习过程。对输入向量U,SOM计算它与每个权重向量W的距离(如Euclid距离),最接近输入向量的神经元mc称为最佳匹配单元(bestmatching unit,BMU),即获胜神经元:
‖U—mc‖=min i‖U—mi‖
(1)
确定获胜神经元后,权重向量更新,获胜神经元向输入向量移动。
如果SOM的输入为Uk=(uk1,uk2,…ukn)T,k=1,2,…,N, 竞争层神经元j的输出为Vj,j=1,2,…,M,连接权重Wj
您可能关注的文档
最近下载
- 2025-2026人教部编版三年级上册语文教学计划.docx VIP
- 施工现场车辆安全教育.pptx VIP
- 给排水系统学习培训ppt课件.pptx VIP
- 2025北京市十八里店乡人民政府城市协管员招聘21人笔试参考题库附答案解析.docx VIP
- 输血科管理制度、程序性文件、SOP文件.docx VIP
- 05J909_工程做法_建筑专业图集.docx VIP
- 2021海绵城市设施通用图集.docx VIP
- 【统编版】高中语文必修上册第一单元《3百合花》优质课(29张PPT)课件.pptx VIP
- 钢丝帘线压延机生产线(中文参考).doc VIP
- 2025年福建省福州市辅警协警笔试笔试预测试题(含答案).docx VIP
文档评论(0)