层次贝叶斯网络聚类方法在上市公司信用风险评估中应用.docVIP

  • 18
  • 0
  • 约3.18千字
  • 约 8页
  • 2018-09-07 发布于福建
  • 举报

层次贝叶斯网络聚类方法在上市公司信用风险评估中应用.doc

层次贝叶斯网络聚类方法在上市公司信用风险评估中应用

层次贝叶斯网络聚类方法在上市公司信用风险评估中应用   【摘要】针对中小企业公司上市过程中存在的信用风险,会对广大投资者产生财产损失的危机,提出应用数据挖掘中的层次贝叶斯方法来对上市公司的信用风险进行综合评价,以准确合理预测公司在财务经营等方面的状况,对投资者具有积极的指导作用。运用层次贝叶斯方法改善了单纯使用贝叶斯方法的局限性,并且在数据有残缺以及事例很少的情况下也能起到预测作用,使上市公司信用风险评估更加可靠。   【关键词】信用风险 层次贝叶斯 数据挖掘 聚类   一、引言   随着中国改革开放以及加入WTO,资本市场已成为国内大中小企业募集资金的场所,上市公司通过在一级市场发行股票证券,并在二级市场流通转让使得公司资本增值,进一步发展壮大。然而机遇与风险并存,上市公司可能存在经营财务以及管理等方面的风险,投资机构以及投资者若不能察觉,便会出现资金贬值损失的风险。正确预测企业财务危机,对于保护投资者的利益,经营者及时防范财务危机,政府部门有效监管上市公司财务风险都具有重大意义。因此,本文提出应用数据挖掘中的层次贝叶斯方法来可靠预测上市公司财务风险。   数据挖掘是具有发展前景的新兴技术,广泛应用于金融,电商等领域,包括朴素贝叶斯,决策树,支持向量机,分类与聚类,神经网络等方法。朴素贝叶斯网络聚类是结合朴素贝叶斯和EM算法进行聚类,朴素贝叶斯方法能够在例子残缺的情况下进行有效的学习和预测,而EM算法对初始值局部贪婪寻优,因而对初始值较为敏感,很可能导致局部极值,聚类结果呈现出类值聚集在少数的极端情况。   通过以上分析,本文结合上市公司信用风险预警需求和朴素贝叶斯网络聚类方法存在的问题,结合朴素贝叶斯网络结构和吉布斯抽样建立层次聚类,构建层次贝叶斯网络聚类模型,能够有效避免经典朴素贝叶斯网络聚类的局部最优问题,将层次贝叶斯算法用于上市公司信用风险评估具有可扩展,灵活性等特点。   二、层次贝叶斯介绍   层次贝叶斯是将聚类方法构建在聚类结构上的过程,将指标体系分为多个层次结构,本文依据上市公司信用风险衡量指标的特点,研究具有两个层次的聚类过程。   (一)结构与特征   层次贝叶斯可以简单理解为几个具有顺序层次的朴素贝叶斯的聚类,通常是星型结构,而层次贝叶斯是星型结构的复合。具有两个层次的层次贝叶斯模型可以分为上层总聚类和下层总聚类,数据由下而上进行分析整合,最终由最上层得出预测结果。   层次贝叶斯具有灵活性特征,变量可以为连续属性或者离散属性;具有可扩展性,对下层叶子节点进行扩展为一个根节点,但扩展层数不宜多,否则降低准确性。扩展后的非根节点可能是变量,朴素贝叶斯或者层次贝叶斯结构。用C,X1,…,Xn表示类变量与属性变量;c,x1,…,xn是具体的取值;D表示数据集;N是数据集中的记录数量,其中前N*个记录具有类标签,后N-N*个记录没有类标签。   (二)常用算法描述   1.支持向量机。简称SVM,是一种监督式算法,广泛应用于统计分析和回归分析中。将向量映射到更高维空间,其中建立一个最大超平面,两边各建立互相平行的超平面并且使其距离最大化,目的是使其误差最小。   2.Apriori算法。基于两阶段频繁数集的思想的递推算法,在关联规则上属于单维度,单层次,布尔关联规则。其中所有支持度大于最小支持度的项级称为频繁项级。   3.最大期望(EM)算法。在概率模型中寻找参数最大的似然估计得算法,依赖于无规则的隐藏变量,常用于机器学习和计算机视觉的数据集聚领域。   4.朴素贝叶斯。模型所需估计参数少,对缺失数据不太敏感,算法简单,理论上具有最小误差率,但实际情况NBC模型假设属性之间相互独立,给正确分类带来负面影响。当属性个数比较多或者之间关联性较大时,效率低于决策树。   三、上市公司信用风险评估   运用层次贝叶斯方法对上市公司信用风险评估,第一步根据需求构建三层指标体系,在指标体系基础上构造聚类结构,最终结合朴素贝叶斯与层次分析法进行聚类。   构建三层指标体系:   (一)一级指标   上市公司信用等级:借鉴国际通用的四等十级制,分别为:AAA(极好),AA(优良),A(较好),BBB(一般),BB(欠佳),B(较差),CCC(很差),CC(极差),C(无),D(破产).   (二)二级指标   上市公司信用二级指标包括:盈利能力,经营效率,偿债能力,资产状况,现金流量,都分为三个等级A(优),B(良),C(差)。   (三)三级指标   盈利能力所属三级指标包括:资产收益率,净资产收益率,毛利率,净利润。   经营效率所属三级指标包括:总资产周转率,存活周转率,存活周转天数,应收账款转转次数。   偿债能力所属三级指标包括:流动比率,速动比率,资产周转率

文档评论(0)

1亿VIP精品文档

相关文档