基于PSO个人信用评估组合预测模型.docVIP

下载本文档

7
0
约5.69千字
约 11页
2018-05-25 发布于福建
举报
版权申诉

基于PSO个人信用评估组合预测模型.doc

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于PSO个人信用评估组合预测模型

基于PSO个人信用评估组合预测模型　　摘要：将组合预测模型用于个人信用评估，在两种单一统计模型的基础上，利用粒子群算法（PSO）求解组合模型的权重，并通过粒子适应度函数的设置来控制第二类误判的发生，构建了基于PSO的组合预测模型。应用结果表明，基于PSO的组合预测模型的分类精度高于单一统计模型，并且有效降低了第二类误判率，对于商业银行控制信用风险具有更好的适用性。　　关键词：粒子群算法；组合预测；个人信用评估　　中图分类号：F832.479文献标志码：Ａ文章编号：1673－291Ｘ（2008）14－0083－04 　　　　随着我国消费信贷市场的迅速发展，个人信用评估的作用日益增强。对于商业银行而言，个人信用评估就是通过考察反映消费信贷申请者的各种指标，对其按时还款的可能性进行全面的判断和评估，从而作出是否放贷的决定。在西方发达国家，对于个人信用评估方法的研究不断发展而且日趋成熟，许多方法被应用到个人信用评估领域[1]，包括线性回归、Logistic回归等统计方法以及以神经网络为代表的人工智能方法等。我国现阶段仍未建立起完善的个人征信体系，各商业银行没有一套科学合理的个人信用评估方法，这种状况严重制约着我国消费信贷的发展。因此，建立适合我国国情的个人信用评估模型是很有意义的。本文将组合预测模型用于个人信用评估，并利用粒子群算法[2]（Particle Swarm Optimization，PSO）来求解模型中的权重，建立基于PSO算法的组合预测模型，并与单一模型进行对比，考察模型的适用性。　　　　1理论背景及模型构建思路　　　　1.1组合预测的基本原理　　组合预测是将各种预测加权重组而得到结果，Clemen曾指出，组合预测将成为预测研究的主流之一[3]。在组合预测理论中，按照集结各单项预测模型的方式大致可分为线性组合和非线性组合，其中，线性组合预测模型是研究最多、应用最广泛的[4]。线性组合预测的基本原理如下：　　1.2基本PSO算法　　1.3模型构建思路　　个人信用评估本质上是模式识别中的一类分类问题，将消费信贷申请者划分为能够按期还本付息和违约两类，从而作出接受或拒绝其信贷申请的决定。在信用评估的实践中通常存在着两类误判：第一类误判是将信用好的客户误判为信用差从而拒绝其贷款申请；第二类误判是将信用差的客户误判为信用好从而接受其贷款申请。一般来说，在银行和其他金融机构的实际操作中，后者给银行造成的损失更大。因此，运用模型进行个人信用评估时，在提高分类精度的同时，应当尽量控制第二类误判的发生。　　本文在个人信用评估中利用线性回归和Logistic回归两种统计方法分别建立单一预测模型，进一步构建基于二者的线性组合预测模型。在权重的求解上，本文尝试采用PSO算法搜索一组权重，为了使组合预测模型能够有效地控制第二类误判发生，通过粒子的适应度函数的设置使PSO算法向第二类误判降低的方向进行权重的搜索。最后通过与单一模型的分类效果进行对比，考察基于PSO算法的组合模型的适用性。　　　　2样本数据及预处理　　　　2.1样本数据　　本文所使用的数据来自深圳某商业银行的消费信贷数据库。分类（是否违约）的标准根据“违约次数”，即在分期偿付贷款时出现还款滞后或还款金额不足的次数进行判定。在国外的实践中，一般认为在上一年中违约次数超过4次，则认为该客户具有较强的违约倾向。本文采用相对严格的分类方法，即只要该违约次数大于0，就定义为违约。同时，将属性缺失较严重的指标剔出，最终选择的数据中包含10个解释指标，这些指标及量化方法列于文尾表1。　　对于这些数据，本文选择分层抽样的方法，将样本分为违约和未违约两类，为了降低数据不均衡对模型分类能力的影响，选择使两类样本个数近似相等。按照上述步骤，最终选择1 057个数据用于模型的建立和测试，并将其随机分为两部分：一部分528个样本，包括257个违约样本和271个未违约样本用于建立模型；另一部分529个样本，包括248个违约样本和281个未违约样本，用于测试模型的分类效果。　　2.2数据的归一化处理　　为了消除量纲的影响以及降低数据不均衡对模型分类能力的影响，本文首先将训练数据和测试数据进行归一化处理。对于本文所采用的10个解释指标，将其分成离散型变量和连续型变量两组。　　　　3模型的构建及应用　　　　3.1单一统计模型　　作为组合预测模型建立的基础，本文首先分别建立线性回归和Logistic回归模型。　　线性回归要求解释变量的分布只有服从一定的前提条件，才能得到较好的结果。在这些前提条件中，一个重要的假定就是解释变量之间不存在较强的相关性，即不存在多重共线性。因此，本文利用SPSS软件建立线性回归模型