- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于支持向量机信用评级分析
基于支持向量机信用评级分析
摘要:公司信用评级分析吸引了众多科研文献对其进行科学研究。近来的研究也表明,相对于传统的统计方法,支持向量机方法在信用评级分析中有着更好的表现。文章就引入了这一相对较新的机器学习技术――支持向量机,来研讨信用评级问题。最后通过实证分析,说明了这一方法的可行性。
关键词:信用评级分析;支持向量机;统计学习理论
支持向量机(support vector machines)是一种建立在统计学习理论基础之上的机器学习方法。其基本思想是,在样本空间或特征空间构造出最优超平面(H),使得超平面与不同类样本集之间的距离最大,从而达到最大的泛化能力。学习的目标是构造一判别函数,将测试数据尽可能正确地分类。其最大的特点是根据Vapnik结构风险最小化原则和VC维理论,尽量提高学习机的泛化能力,即由有限的训练集样本得到小的误差,但仍然能够保证对独立的测试集保持小的误差。另外,由于支持向量算法是一个凸优化问题,所以局部最优解一定是全局最优解。因此它能较好地解决小样本、非线性、高维数和局部极小点等实际问题,在时间序列预测、回归估计预测、人脸识别以及分类等方面都有良好的应用。
一、 支持向量机的原理
假设训练样本集为{(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rn,对于二类分类问题,yi∈{+1,-1},i=1,2,3,…,n。n维空间中线性判别函数一般为:g(X)=W?X+b,其分类超平面定为:W?X+b=0,其中X是超平面上的点,W是超平面的法向量,b是偏置量,也称为分类阈值。分布在两类分类超平面上的点向量称为支持向量,它们距离最优超平面最近。两分类超平面之间的距离叫做分类间隔(Margin),在两类线性可分的情况下,SVM通过寻找最优分类超平面实现结构风险最小化,所谓最优分类超平面就是要求分类面不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。这等同于求以下凸二次规划的解:
上式表明,对不同类别错误划分的惩罚与样本数目成反比。
三、 关于信用评级的实证分析
1. 指标体系的建立。由于财务比率的好坏在很大程度上反映了企业的总体经营状况和财务状况,所以我们主要从财务的角度建立信用风险评估模型,其他一些非财务指标或者是定性的分析可以通过专家系统处理。通过专家评分,把一些定性的东西转化成定量的指标。本文选取的两个定性指标是行业现状分析和公司竞争力分析。根据公司在全球以及在国内的总体发展态势,以及在同行业中的地位,给予公司不同的量化得分,满分为1分。这也是为了与以下财务变量的数据相统一。根据常用的准则以及专家的建议,在长期信用评价方面,我们用了7个指标来衡量企业的财务状况:(1)净资产利润率(净利润/所有者权益);(2)资产负债比率(负债总额/资产总额);(3)经营活动净现金/总债务;(4)EBITDA/利息支出(EBITDA是指息税折旧摊销前盈余);(5)总资产周转率(年销售收入净额/平均总资产);(6)行业现状评分;(7)公司竞争力评分。在短期信用评价方面,我们选取了了6个指标来衡量企业的财务状况:(1)净资产利润率;(2)资产负债比率;(3)经营活动净现金/短期债务;(4)EBITDA/利息支出;(5)总资产周转率;(6)速动比率。在债券信用评级方面,我们选取了了6个指标来衡量企业的财务状况:(1)净资产利润率;(2)资产负债比率;(3)经营活动净现金/总债务;(4)EBITDA/利息支出;(5)总资产周转率;(6)速动比率。
2. 评级预测。根据上述的分析,构造了样本集(x,y),其中长期信用评价x的维数为7,短期信用评价x的维数为6,债券信用评级x的维数为6。y是样本的类别属性,对于长期信用评价,“1”表示企业被评为A级,“2”表示AA级,“3”表示AAA级。对于短期信用评价,“1”表示企业短期信用被评为A―1+级,“2”表示A―1级,“3”表示A―2级。在债券信用评级方面,“1”表示企业被评为A级,“2”表示AA级,“3”表示AAA级。本文使用LS―SVMLAB Matlab Toolbox(Version 1.5)工具包进行实验分析。SVM中不同的内积核函数将形成不同的算法,目前研究最多的核函数主要有线性核函数、多项式函数、径向基函数、多层感知器(MLP)核函数函数4种。本文构造的SVM模型的内积核函数采用最常用的径向基函数。综合考虑最少错分样本数和最大分类间隔,在高维空间中构造软间隔。在给定绩效测度情形下,模型中的参数sig2,gam采用tunelssvm函数确定,优化算法采用gridsearch,最终确定长期信用评价的sig2=0.35,gam=10.92;短期信用评价的sig2=0.
原创力文档


文档评论(0)