基于选择性集成违约预测模型设计.pdfVIP

  • 6
  • 0
  • 约1.16万字
  • 约 7页
  • 2017-08-10 发布于安徽
  • 举报
江苏省系统工程学会第十一届学术年会 基于选择性集成的违约预测模型设计 梁雪春,祝煜 (南京工业大学自动化与电气工程学院,江苏南京2l0009) 摘要:违约预测是银行面对企业贷款时必须要进行的工作。统计方法和人工智能技术已深入探 讨研究这个问题。大多数研究人员为特定的数据集使用不同的技术性能比较预测。但是,不同技术 在处理不同的数据集时有不同的优缺点。最近的研究表明,结合多分类器可以得到更好的结果。然 而,这样一个集合通常不仅继承优势的不同的分类,而且还继承了这些分类的缺点。本文提出了三 个分类的选择性集成,即决策树、BP神经网络和支持向量机。基于违约和不违约的预期概率,提出 了继承不同的分类技术优点,避免其缺点的方法思路。理论上可以证明,此选择性集成的预测准确 性优于其它权重或投票集成。 关键词:违约:预期概率;选择性集成 1引言 对企业有效的违约预测具有巨大的价值。金融机构一个错误的决定可能会导致小企业财务困境, 银行损失惨重。因此有许多研究一直致力于违约预测。在技术上主要采用两类方法处理这一问题。 第一类使用统计技术,如回归分析,相关分析,判别分析,Logit模型,probit模型等。第二类利用 人工智能如人工神经网络(砧啪),支持向量机(SVM)等。大多数研究人员对特定的数据集利用 一个具体的方法和与其他方法比较预测结果【l】【2】【31。但是,没有一致的结论可以证明某一个特定技术 优于其他。 在本文中,我们选择像专家一样的分类器进行违约预测。对于一个特定的数据集,每个分类器 都有特定的倾向。例如,一些分类器倾向于对违约数据的预测而其他分类器对非违约数据能很好的 预测。也就是说,对违约的预测有倾向的分类器能较准确的预测违约的企业,这意味着,他们要严 格得多的预测非违约企业。因此,当企业预测为非违约时它能提供更可信的预测。这一概率被定义 为预期概率,并提供了一个暗示以选择合适的分类器建立一个集成。本文的主要目的是研究一种方 法来选择适合的分类器,并检验如何提高整个模型的预测精度。因而我们为违约预测提出了一个基 于预期概率的选择集成。 2基于选择性集成的违约预测 2.1违约预测模型的发展 违约预测模型大致经历了以下两个阶段:第一阶段是违约概率评估的单变量分析。第二阶段是 违约概率评估的多变量分析。典型代表包括多元判别分析、Lo醇模型、主成分分析以及神经网络模 型等。 最早的违约预测模型是Beaverl966年提出的。从他的开创性工作始于20世纪60年代后期, 问题的公司,并选择相似规模,同一行业和时期的另79家财政健康的公司。基于单因素分析,Beaver 联系人:祝煜(1984一),女。硕士在读,E-maih 江苏省软科学项目(BR2008098) .257. 江苏省系统工程学会第十一届学术年会 认为,现金流与债务总额的比率、纯收入与总资产的比率以及债务总额与总资产的比率是三个最有 效的预测财务比率。 基于5个财务比率,即周转资金/资产总额,现存收益/总资产,扣除利息和税金/总资产,股权市场 价值/债务总额,销售/总资产。 然而,当数据分布不遵循常态分布时,多元判别分析可能会导致显着性检验的偏差和预测的准 确性。在这种情况下,其他一些统计方法能够克服这个困难。例如,线性概率模型,logit及probit模 型。 另一方面,许多计算智能中的数据挖掘技术应用于违约预测。Tamand飚ang[41从美国得克萨斯 四种不同的技术,如人工神经网络,MDA,t,ogit模型和决策树。根据他们的实验,神经网络和决 策树有更好的预测性能。 M/nand MDA、神经网络和Logit模型。West,Dellana,andQian[6】比较单一的神经网络模型和基于交叉验证, 神经网络。 从上述文献可以看出,大多数的研究人员只集中关注单一预测技术。本文,我们提出了一种基 于每个技术(决策树,神经网络和SVM)在违约和非违约预测中的预期概率的合成技术。这样做的 目的是,延续这三个模型的优点,避免三个模型的缺点。 2.2选择性集成的技术介绍 trees) 2.2.1决策树(Decision

文档评论(0)

1亿VIP精品文档

相关文档