机器学习在企业信用评级中的应用研究.pdfVIP

  • 114
  • 0
  • 约4.56万字
  • 约 40页
  • 2021-10-26 发布于江苏
  • 举报

机器学习在企业信用评级中的应用研究.pdf

摘要 摘 要 随着经济不断快速发展,次贷危机所产生的影响引发了人们深刻的反思,企业信 用问题逐步成为人们的焦点。目前,我国拥有许多家评级机构,但是所得的评级结果 错综不一,各公司应用的评级标准也并不相同,同时企业间行业差距与规模差距仍是 不可忽略的问题。现如今,国内许多信用评级模型仍较为落后,主观性更强。本文的 目标是建立一个企业信用评级更科学、更完善、更合理的信用评级体系,并得到预测 准确度最高、更适用于企业信用评级问题的模型。 本文采用的评级数据皆用不同评级公司相同的企业信用评级结果,减少了由于评 级机构的差异所带来的评级结果的差距。同时,本文加入了规模指标与行业指标,结 合财务指标进行分析。文中共采用了 35 个指标,825 家上市企业的财务数据、行业 数据与评级数据作为输入,对其进行特征选择并建立企业信用评级体系。本文利用机 器学习的方法,可以减少对数据要求的苛刻程度。由于金融指标大多存在非线性、小 样本等特性,传统的信用评级模型,如回归模型等线性数学模型,无法很好地适用于 这一类数据。而机器学习可以很好地解决这一问题,同时还能快速地计算结果,提升 了计算运行速度,并且拥有很强的泛化能力。本文利用机器学习的分类方法,采用了 决策树、随机森林与Adaboost 三种不同的机器学习方法,建立新的指标集,并通过 交叉验证的方式防止过拟合情况出现。对于小样本数据而言,机器学习较为常用的方 法为支持向量机,能保证小样本数据预测结果更优。因此本文在特征选择后,采用了 与支持向量机相结合的方法。通过特征选择选出合适的指标集,应用于支持向量机模 型中,与采用单一的机器学习方法 (决策树、随机森林、Adaboost 、支持向量机)建 立的模型进行比较,结果显示,通过特征选择的模型准确度更高,更适用于企业信用 评级模型的建立。 对上市企业进行的实证研究表明,相对于纯粹的机器学习模型应用,经过特征选 择过的企业信用评级模型准确率更高,误差更低,更适用于企业信用评级的模型建立。 从本文结果来看,在我国上市企业的信用评级方面,通过随机森林特征选择后的支持 向量机模型更为适用。 关键词:特征选择;机器学习;企业信用评级;评级指标体系 I 机器学习在企业信用评级中的应用研究 目 录 第1 章 绪论………………………………………………………………………………1 1.1 研究背景与意义…………………………………………………………………1 1.1.1 研究背景 1 1.1.2 理论意义 3 1.1.2 现实意义 4 1.2 文献综述…………..……………………………………………………..………6 1.2.1 企业信用评级的发展 6 1.2.2 机器学习的发展 7 1.2.3 特征选择发展 8 1.3 研究思路与内容…………………………………..……………………………10 1.3.1 研究思路及问题 10 1.3.2 研究内容 10 1.3.3 技术路线图 12 1.4 本文创新点与不足……………………………………………………………..13 第2 章 企业信用评级数据采集、变量选取与描述性统计…………………………..14 2.1 企业信用评级中评级数据采集………………………………………………..14 2.2 企业信用评级中变量选取……………………………………………………..15 2.3 描述性统计……………………………….…...………………………………..16 2.4 本章小结………………………………………………………………………..18 第3 章 企业信用评级关键影响变量的筛选…………………………………………..19 3.1 基于决策树的企业信用评级的特征选择……………………………………..19 3.1.1 决策树方法介绍 19 3.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档