- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
疫情前后公司违约模型预测能力及指标解释力度比较研究——基于Logistic 回归和随机森林
摘 要
2020年初突发的新冠疫情给全球经济带来巨大的冲击,各国进出口和贸易往来(医
疗行业除外)减少,同时国内经济活动也由于疫情的影响而被迫减少,使得很多企业出
现亏损,进而导致这些企业对其债务出现违约。目前,公司违约模型主要分为传统模型
和机器学习模型两大类。在新冠疫情爆发后,以上两个模型对于公司违约的预测能力尚
未得到很好的检验。因此在当前新冠疫情带来的新市场环境中,对于公司违约模型的预
测能力和指标解释力度进行分析,以筛选出更适合当前新市场环境的公司违约模型和指
标体系,从而更好地对公司违约风险进行管理,便显得尤为重要。
本文基于Logistic 回归和随机森林模型,对疫情前后公司违约模型的预测能力和指
标解释力度进行比较分析,进而为金融风险管理实际工作提供模型选择和指标选取方面
的基础性指导。本文的研究能够帮助公司违约模型的使用者更好地应对公司违约所带来
的损失,对于债券发行主体相关的信用风险进行更科学的管理,以保证我国金融行业健
康有序的发展。
基于以上研究目的,本文选取2017 年 12 月31 日到2021年9 月30 日我国公开发
2019 12 31
行信用债券的公司相关财务季度数据进行研究。首先,本文以 年 月 日新冠
疫情在我国爆发作为疫情前后时间区分节点,将收集的样本数据划分为疫情前样本和疫
情后样本。为了对公司违约模型进行构建和验证,本文将疫情前后的样本分别按照4 ︰1
的比例划分训练集和验证集的数据,其中训练集数据用于模型的构建,验证集数据用于
模型的预测能力和指标解释力度分析。在财务指标选取方面,本文选取了反映公司偿债
能力、营运能力、盈利能力和成长能力四个方面总共21个指标作为模型的输入变量。
在模型预测能力分析方面,本文以召回率、精确率、F1值和ROC 曲线的AUC 值4 个
指标做为模型预测能力的评价标准。在指标解释力度分析方面,本文使用SHAP 工具,
对于模型输入指标对模型输出结果的贡献度以及各自相对重要性的排序进行可视化的
展示。
1 Logistic
本文通过比较研究主要得出四点结论:()在 回归模型预测能力方面,疫
情后Logistic 回归模型的预测能力要优于疫情前Logistic 回归模型的预测能力。Logistic
回归模型具有较好的稳健性,在新冠疫情给债券市场带来新的冲击之下,仍然能够较好
地对公司违约进行预测,能够适应新的债券市场环境。 (2)在随机森林模型预测能力
方面,疫情后随机森林模型的预测能力略优于疫情前随机森林模型的预测能力。随机森
林模型整体稳健性较好,能够较好捕抓新冠疫情所带来的新市场环境中公司违约的新特
点,对公司违约进行预测的能力较稳定。(3)在Logistic 回归模型的指标解释力度方面,
疫情前的Logistic 回归模型对模型输出结果解释力度最强的前5个指标分别是销售毛利
I
摘要
率、流动资产周转率、总资产周转率、总资产同比增长率和流动比率。在本文选取的4
大类财务指标中,营运能力指标整体对于模型输出结果解释力度最强。而在疫情后的
Logistic 5
回归模型中,对模型输出结果贡献度最大的前 个指标分别是总资产周转率、
现金比率、销售毛利率、资产负债率和总资产同比增长率。在本文选取的四大类财务指
标中,偿债能力指标整体对于模型输出结果解释力度最强。 (4)在随机森林模型的指
5
标解释力度方面,疫情前的随机森林模型对模型输出结果解释力度最强的前 个指标分
别是每股收益、净资产收益率、总资产报酬率、利息保障倍数和现金比率。在本文选取
的4 大类财务指标
文档评论(0)