浅析基于数据挖掘技术上市公司信用风险评估.docVIP

下载本文档

4
0
约5.37千字
约 10页
2017-07-06 发布于福建
举报
版权申诉

浅析基于数据挖掘技术上市公司信用风险评估.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

浅析基于数据挖掘技术上市公司信用风险评估

浅析基于数据挖掘技术上市公司信用风险评估【摘要】近年来,数据挖掘方法被广泛应用于金融、经济领域,在信用风险方面也受到越来越多的重视。本文尝试将数据挖掘方法引入信用风险预测问题中,全面比较决策树、神经网络和支持向量机算法在上市公司信息风险预测问题上的优劣,以期为我国上市公司信用风险预测起到参考作用。【关键词】数据挖掘信用风险决策树支持向量机一、引言我国上市公司是整个国民经济整体的一个有机组成部分,甚至可以说是整个国民经济的核心所在。至2008年底,沪深两市的股票总市值在缩水62.9%的情况下仍达到12.13万亿,占GDP的48.6%。从这些数据可以看出,上市公司在我国经济中占有主体地位,因此,上市公司的优劣存亡将关系到整个国民经济的发展。然而,我国上市公司所积累的信用风险已经非常巨大,在深交所的诚信档案里仅主板市场就列出了20页的违规通报批评和处分决定。就国有企业而言,信用危机依然存在,突出的表现就是恶意拖欠逃债现象。企业信用风险状况直接关系到我国金融市场的健康发展和国民经济的持续稳定。可见,对上市公司信用风险的管理是非常必要和迫在眉睫的,而上市公司信用风险评估模型的建立是防范信用风险的重要手段。因此,研究上市公司信用风险评估这一课题,已经成为我国目前经济生活中亟待解决的一个重要问题。目前许多定量技术和支持工具、软件已付诸商业应用,继传统的比例分析之后,统计方法得到了广泛的应用,如判别分析和Logistic回归等。信用等级评估是通过对企业或个人的某些单一财务指标进行加权平均确定的,该方法最大的缺陷在于指标和加权值的确定带有很大的主观性,使得评估结果和实际状况有很大的出入。因此,需要引入科学方法来确定有效评估指标,并建立准确的定量模型来解决信用等级评估的问题。近年来,信息技术得到了迅速发展,如数据挖掘技术等能从海量数据中智能发现有用的规则和知识,再加上我国上市公司信息披露制度的不断完善,使得我们的研究能够得到的数据资料也不断的增多,这些有利条件的出现使得我们对基于数据挖掘的上市公司信用风险评估模型的研究有了数据基础和技术基础。二、基于数据挖掘的信用风险评估模型比较综述 1、决策树决策树方法于20世纪60年代起源于对概念学习建模;20世纪70年代后期Quinlan发明用信息增益作为启发策略的ID3算法,从样本中学习构造专家系统;1993年Quinlan在ID3算法基础上研究出了改进的决策树归纳包(C4.5),这是目前被普遍采用的数据分类方法。其思想是一个类似于流程图的树结构,其中每个内部结点表示在一个属性熵的测试,每个分支代表一个测试输出,而每个树叶节点代表类或类分布。决策树通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类,树上每个节点说明了对实例的某个属性的测试,节点的每个后继分支对应于该属性的一个可能值。决策树分类模型之所以被广泛应用于信用风险评估,主要是因为决策树具有以下优点:(1)与神经网络或贝叶斯分类等其他分类模型相比,决策树的分类原理简单易懂,很容易被使用人员理解和接受。在决策树分类过程中,一般不需要人为设定参数,更适合于知识发现的要求;(2)决策树的学习算法具有建立速度快、计算量相对不是很大、可以处理连续值和离散值属性;(3)决策树能使用信息原理对大量样本的属性进行信息量分析,计算各属性的信息量,找出反映类别的重要属性(可以清晰的显示哪些属性对分类比较重要);(4)决策树分类方法与其他分类模型相比,易于生成可理解的规则。决策树方法对记录数越大的数据库,它的效果越明显,这就是它显著的优点。研究表明,一般情况下,树越小则树的预测能力越强。要构造尽可能小的决策树,关键在于选择恰当属性。而属性选择依赖于各种对例子子集的不纯度度量方法。其中,基于数据挖掘中决策树C4.5算法的分析框架建立的上市公司信用风险评估模型,对数据分布无任何要求,应用于上市公司信用风险评估的效果比较好,因此具有良好的发展前景,值得我们深入研究。 2、神经网络 BP网是面向映射变换的神经网络中应用最广泛的一种,其结构如图1所示。典型的BP网有三个层次:输入层、隐含层和输出层,相邻层次神经元间采用全互连形式,同层神经元间则不相连。其思路是:当给网络提供一个输入模式时,该模式由输入层传到隐含,经隐含层神经元作用函数处理后传送到输出层,再经由输出层神经元作用函数处理后产生一个输出模式。如果输出模式与期望的输出模式有误差,就从输出层反向将误差逐层传送到输入层,把误差“分摊”给各神经元并修改连接权,使网络实现从输入模式到输出模式的正确映射。对于一组训练模式,可以逐个用训练模式作为输入,反复进行误差检测和反向传播过程,直到不出现误差为止。这时,BP网完成了学习阶段