一个新银行信用风险评估方法.docVIP

下载本文档

128
0
约3.01千字
约 7页
2018-08-11 发布于福建
举报
版权申诉

一个新银行信用风险评估方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一个新银行信用风险评估方法

一个新银行信用风险评估方法　　［摘要］本文以银行信用风险管理为例，将粗糙集和决策树两种具有互补优势的数据挖掘方法相结合，对客户信用做出归类分析判断，最后利用决策树生成决策规则。实践证明，这种方法忠于原始数据，提高了分类准确度，减小了决策树规模，具有良好的性能。　　［关键词］粗糙集；决策树法；银行信用风险　　doi:10.3969/j.issn.1673-0194.2009.15.033 　　［中图分类号］F830.51［文献标识码］A［文章编号］1673-0194（2009）15-0108-04 　　　　1 引言　　　　近来，由美国引发的信贷危机表明，世界银行业对信用风险管理环节还缺乏较为有效的测量和评估手段。面对海量银行客户数据，如何从中发现有价值的信息或知识，成为一项重要的任务。数据挖掘作为一种潜在的、功能强大的新技术，能够帮助银行在大量的、隐含的、事先未知的数据中找到重要的和有价值的信息，使银行信贷活动具有前瞻性，有助于银行做出基于客户信息的决策。　　被广泛应用于信用风险研究的模型主要有数值统计模型和人工智能模型两类［1］。传统的统计模型有多元判别分析、logistic回归分析等。20世纪80年代以来，人工智能得到了大力的发展，专家系统、神经网络、SVM等人工智能技术被引入信用风险评估中，克服了统计方法对假设要求严格的缺点。但是这些新方法又各有不足，神经网络法的网络结构难以确定，训练时容易陷入局部极值，训练效率不高；SVM要求在机器学习过程中正反两类样本数据的数量尽量接近，这和信用风险的实际情况不相符，会有一定的主观性和局限性。针对这些缺点，本文提出使用数据挖掘中最为成熟并被广泛使用的决策树理论算法建立模型，使用粗糙集对数据进行预处理，经过实证分析，取得了较好的效果。　　　　2 粗糙集计算方法和决策树方法概述　　　　2.1 粗糙集计算方法　　对于信息系统??S={U，A=C∪D，V，f}，其中，U为有限对象集合，即论域；C为条件属性集合， D为决策属性集合，且满足C∩D=?迹?则称S为决策系统；V为C和D的值域；函数f(x,q)∈V??q,?歇?q∈A,x∈U。这样U中的每一个对象x都可以用一个基于属性值A的矢量表示，而属性值A表明对象x可以获得的知识信息。在一个决策系统中，各个条件属性之间往往存在着某种程度上的依赖和分类，约简可理解为在不丢失信息的前提下，以最简单地表示决策系统的决策属性对条件属性集合的依赖和分类［2］。　　设P和Q为U中的等价关系(IND(P))，Q的P正域记为POS??p(Q)，即POS??p(Q)=UPX,x∈U/Q, Q的正域是U中所有根据分类U/P的信息，可以准确地划分到关系Q的等价类中去的对象的集合。C1称为C相对于决策属性集D的约简，即C的D约简，如果满足：　　C1??C, C1≠?迹? 　　POS??IND(C1)(IND(D))=POS??IND(C)(IND(D)); 　　不存在C2??C1，使POS??IND(C2)(IND(D))=POS??IND(C1)(IND(D)) , 　　则 C的所有D约简的集合记为RED??D(C)，C的所有D约简的交集称为核，即CORE??D(C)=∩RED??D(C)，可以利用C相对于D的任一约简来代替C，而不会对决策有任何影响，这就是粗糙集属性约简的原理。?? 　　2.2 决策树方法　　作为数据挖掘中核心算法之一，决策树算法通常被用于从海量数据中挖掘出有效的、正确的且可理解的信息。决策树的优点是不受原始数据的约束，可以是数值型的和非数值型的数据，因为有用户界面，所以操作直观，容易理解。构建决策树的基础算法为贪婪演算法，即在判断属性节点时，总是选取信息增益最高的属性作为下一个节点并创建分支，由此得到的决策树规模最小、外观友好，适于规则的归纳掌握。　　国际上最有影响和最早的决策树方法是J . R. Quinlan 提出的ID3 方法，它计算信息增益的方式以熵值为基础，设属性??A 具ν个不同值{a1,a2,…,a??j,…,a??ν}，可以用属性A将S划分为ν个子集{s??1,s??2,…,s??j,…,s??ν}，其中S??j包括S中这样一些样本，它们在A上具有值a??j，如果A选作测试属性，则这些子集对应于包括集合S的节点长出来的分枝。设s??i,j是子集S??j中类C??i的样本数，由A划分成子集的熵为：　　 E(A)=∑νi=1s??i,j+…+s??m,jsI(s??i,j,…,s??m,j)。　　其中，s??i,j+…+s??m,js为第j子集的权重。　　E(A)值越小，子集纯度越高。I(s??1,j,s??2,j,…,s??m,j)=∑mi