模糊中心化支持向量机模型及其在信用风险评估应用.pdfVIP

下载本文档

19
0
约2.34万字
约 9页
2017-08-09 发布于安徽
举报
版权申诉

模糊中心化支持向量机模型及其在信用风险评估应用.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

模糊中心化支持向量机模型及其在信用风险评估中的应用 Fuzzy Proximal Support Vector Machine with Application to Credit Risk Evaluation 姚潇, 余乐安  中科院数学与系统科学研究院, 北京 100190, 中国摘要：支持向量机是近些年兴起的人工智能方法，并在信用风险分析领域得到了广泛应用。为了有效地减小在实证研究中样本的奇异点和噪声对模型的干扰，我们在中心化支持向量机的基础上，引入模糊隶属度的思想，提出了模糊中心化支持向量机，使之不仅能保留中心化支持向量机原有的优点，同时也可以减小奇异点和噪声对模型的干扰，从而进一步提高了分类判别能力。同时我们注意到，当模糊隶属度的取值都为 1 时，这一模型退化成为原来的中心化支持向量机。最后我们对两个公开可得的信用数据集进行实证研究，通过与其它模型结果的对比能够看到与其它模型相比，本文提出的这一模糊中心化支持向量机能够显著地提高分类精度，具有较高的实用价值。关键词：信用风险评估；中心化支持向量机；模糊隶属度； 1、导言随着商业银行信贷业务的不断发展，信用风险评估已经成为大家关注的焦点。为了尽量避免损失，信用评估模型需要充分高的精确度来预测客户是否会违约。所以从本质上看，可以将这一问题转化成为分类模型，基于这一点，很多分类方法都应用到这一领域，而判断一个模型的好坏，最重要的就是尽可能地提高分类的准确率。传统的分类方法都是基于经典的统计学方法比如判别分析，logit 和 probit 模型[1-5]。这些模型简单实用，但也有其局限性，即当样本线性可分时会表现得很好，而在非线性问题上则表现不佳。近几十年随着人工智能这一领域的快速发展，很多新的智能数据挖掘方法被提出来，比如人工神经网络、支持向量机等。与经典的统计模型相比，人工神经网络可以更好地处理非线性问题，在信用风险分析领域也有着广泛的应用[6-7]。但是它的缺点也很明显，即它有可能陷入局部最优解而无法得到全局最优解，而且它是基于经验风险最小化原则，经常会出现“过拟合”现象，也就是在样本内可以拟合得很好，可泛化能力较差。近些年来，支持向量机的出现和发展为信用风险评估提供了一个更加理想的选择。标准支持向量机模型(C-SVM)是 Vapnik 在上个世纪 90 年代提出的基于结构风险最小化原则的一种全新的统计学习方法[8-9]。与以往的基于经验风险最小化原则的机器学习方法相比，支持向量机不仅仅考虑训练样本的经验风险，同时还兼顾算法的泛化能力，从而有效地提高了算法的准确率。支持向量机通过最大化两个支撑超平面的间隔实现了结构风险最小化原则，将把一个分类或者回归问题转化成一个二次凸规划问题，从而保证该模型有全局最优  通讯作者. Tel.: 8610 Fax: 8610 Email: yulean@amss.ac.cn 解。随后，Suykens 等人在此提出了最小二乘支持向量机(LSSVM)，并通过实验证明相比原来的 C-SVM，LSSVM 的泛化能力有了进一步提高[10-11]。而 Fung 和 Mangasarian 也提出了中心化支持向量机模型(PSVM)，与 C-SVM 相比这一模型的泛化能力同样有明显地改进 [12]。当支持向量机模型在处理噪音比较大的数据集时，容易受到奇异点的干扰而导致结果不尽理想，为了减小这些奇异点的影响，Lin 和 Huang 等人将模糊化的思想引入到 C-SVM 中，提出了模糊支持向量机模型(fuzzy SVM)，其思想是对每个样本点赋予不同的隶属度，通过对那些奇异点给予较低的隶属度，使得它们对模型的影响变小，从而提高模型精度 [13-14]。Abe 等人进一步将模糊化思想引入到 LSSVM ，并且着重讨论了多类分类问题 [15] 。由于支持向量机良好的性质，所以很多研究都将支持向量机作为信用风险分析领域的一个重要工具[16-19]。同时，为了进一步提高模型精度，又有很多基于智能方法集成模型被提出，它们都在不同程度上对改进了模型的泛化能力[20-21]。本文在[12-14]的基础上提出了模糊中心化支持向量机模型(fuzzy PSVM)，主要思想是通过对样本赋予模糊隶属度来减小奇异点和噪声的对模型的影响，同时利用样本的中心和半径来获得每一个样本点的模