- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于PSO个人信用评估组合预测模型
基于PSO个人信用评估组合预测模型
摘要:将组合预测模型用于个人信用评估,在两种单一统计模型的基础上,利用粒子群算法(PSO)求解组合模型的权重,并通过粒子适应度函数的设置来控制第二类误判的发生,构建了基于PSO的组合预测模型。应用结果表明,基于PSO的组合预测模型的分类精度高于单一统计模型,并且有效降低了第二类误判率,对于商业银行控制信用风险具有更好的适用性。
关键词:粒子群算法;组合预测;个人信用评估
中图分类号:F832.479文献标志码:A文章编号:1673-291X(2008)14-0083-04
随着我国消费信贷市场的迅速发展,个人信用评估的作用日益增强。对于商业银行而言,个人信用评估就是通过考察反映消费信贷申请者的各种指标,对其按时还款的可能性进行全面的判断和评估,从而作出是否放贷的决定。在西方发达国家,对于个人信用评估方法的研究不断发展而且日趋成熟,许多方法被应用到个人信用评估领域[1],包括线性回归、Logistic回归等统计方法以及以神经网络为代表的人工智能方法等。我国现阶段仍未建立起完善的个人征信体系,各商业银行没有一套科学合理的个人信用评估方法,这种状况严重制约着我国消费信贷的发展。因此,建立适合我国国情的个人信用评估模型是很有意义的。本文将组合预测模型用于个人信用评估,并利用粒子群算法[2](Particle Swarm Optimization,PSO)来求解模型中的权重,建立基于PSO算法的组合预测模型,并与单一模型进行对比,考察模型的适用性。
1理论背景及模型构建思路
1.1组合预测的基本原理
组合预测是将各种预测加权重组而得到结果,Clemen曾指出,组合预测将成为预测研究的主流之一[3]。在组合预测理论中,按照集结各单项预测模型的方式大致可分为线性组合和非线性组合,其中,线性组合预测模型是研究最多、应用最广泛的[4]。线性组合预测的基本原理如下:
1.2基本PSO算法
1.3模型构建思路
个人信用评估本质上是模式识别中的一类分类问题,将消费信贷申请者划分为能够按期还本付息和违约两类,从而作出接受或拒绝其信贷申请的决定。在信用评估的实践中通常存在着两类误判:第一类误判是将信用好的客户误判为信用差从而拒绝其贷款申请;第二类误判是将信用差的客户误判为信用好从而接受其贷款申请。一般来说,在银行和其他金融机构的实际操作中,后者给银行造成的损失更大。因此,运用模型进行个人信用评估时,在提高分类精度的同时,应当尽量控制第二类误判的发生。
本文在个人信用评估中利用线性回归和Logistic回归两种统计方法分别建立单一预测模型,进一步构建基于二者的线性组合预测模型。在权重的求解上,本文尝试采用PSO算法搜索一组权重,为了使组合预测模型能够有效地控制第二类误判发生,通过粒子的适应度函数的设置使PSO算法向第二类误判降低的方向进行权重的搜索。最后通过与单一模型的分类效果进行对比,考察基于PSO算法的组合模型的适用性。
2样本数据及预处理
2.1样本数据
本文所使用的数据来自深圳某商业银行的消费信贷数据库。分类(是否违约)的标准根据“违约次数”,即在分期偿付贷款时出现还款滞后或还款金额不足的次数进行判定。在国外的实践中,一般认为在上一年中违约次数超过4次,则认为该客户具有较强的违约倾向。本文采用相对严格的分类方法,即只要该违约次数大于0,就定义为违约。同时,将属性缺失较严重的指标剔出,最终选择的数据中包含10个解释指标,这些指标及量化方法列于文尾表1。
对于这些数据,本文选择分层抽样的方法,将样本分为违约和未违约两类,为了降低数据不均衡对模型分类能力的影响,选择使两类样本个数近似相等。按照上述步骤,最终选择1 057个数据用于模型的建立和测试,并将其随机分为两部分:一部分528个样本,包括257个违约样本和271个未违约样本用于建立模型;另一部分529个样本,包括248个违约样本和281个未违约样本,用于测试模型的分类效果。
2.2数据的归一化处理
为了消除量纲的影响以及降低数据不均衡对模型分类能力的影响,本文首先将训练数据和测试数据进行归一化处理。对于本文所采用的10个解释指标,将其分成离散型变量和连续型变量两组。
3模型的构建及应用
3.1单一统计模型
作为组合预测模型建立的基础,本文首先分别建立线性回归和Logistic回归模型。
线性回归要求解释变量的分布只有服从一定的前提条件,才能得到较好的结果。在这些前提条件中,一个重要的假定就是解释变量之间不存在较强的相关性,即不存在多重共线性。因此,本文利用SPSS软件建立线性回归模型
文档评论(0)