- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
使用机器学习识别信用风险 4
数据处理与特征选择 6
数据截面选取 6
信用风险样本与正常样本的不平衡性 6
违约以及评级下调数据处理 6
信用风险数据集划分 6
正常样本 7
不平衡样本数据处理 7
特征选取 7
分类模型训练与测试 9
模型评估参数介绍 9
逻辑回归 9
随机森林 11
支持向量机 13
XGBoost 15
LightGBM 17
各类模型性能比较 18
特征重要性 19
最新截面债券信用风险预测 21
调整概率的计算 21
最新截面预测 21
风险提示 23
图表目录
图表1:通用机器学习流程图 4
图表2:发生信用风险的债券对应的上市公司在财报截止日之间的表现统计 5
图表3:债务信用风险识别模型因子选取 8
图表4:Logistic回归ROC曲线 10
图表5:Logistic回归AUC 10
图表6:Logistic回归召回率 10
图表7:随机森林单颗决策树最大深度 12
图表8:随机森林单颗决策树抽取特征数量 12
图表9:随机森林ROC曲线 12
图表10:随机森林AUC分布 12
图表11:随机森林召回率分布 13
图表12:支持向量机ROC曲线 14
图表13:支持向量机AUC分布 14
图表14:支持向量机召回率分布 15
图表15:XGBoostROC曲线 16
图表16:XGBoostAUC分布 16
图表17:XGBoost召回率分布 16
图表18:LightGBMROC曲线 18
图表19:LightGBMAUC分布 18
图表20:LightGBM召回率分布 18
图表21:各分类模型性能汇总 19
图表22:随机森林特征平均重要性 19
图表23:随机森林准确预测了最新一期截面上已发生的风险事件 21
图表24:最新截面信用风险调整概率超50%转债 22
使用机器学习识别信用风险
传统的债券违约模型大致可分为线性模型和非线性模型两大类。线性模型中,最具代表性的如AltmanZ-score模型,该模型通过计算多个财务比率并加权得出一个综合风险评分,简便易用,但其局限性也较为明显,主要在于选取的财务指标较少,可能无法全面反映债务人的财务状况。非线性模型方面,最具代表性的为Merton模型,它基于期权定价理论,将企业违约定义为企业资产价值小于债务账面价值,使用Black-Scholes公式对企业的股票和负债进行估值,从而推算违约概率。此模型能够较好地捕捉资产价格波动,但在实际应用中对参数的依赖较大,且未能考虑跳跃性事件的影响。
机器学习作为对债券市场传统违约模型的重要补充,主要体现在其强大的数据处理能力和自适应特性。传统模型通常依赖于固定的财务指标和简单的假设,可能难以捕捉债券违约风险中潜在的复杂非线性关系。而机器学习模型能够自动从大量历史数据中挖掘潜在的规律和模式,尤其在面对非线性特征时表现出色。除此之外,机器学习方法能够有效处理大规模数据和缺失值,避免了传统模型在数据不完全时的局限性。由于其强大的自适应性,机器学习模型可以随着市场环境的变化实时更新,提供更加精确和个性化的风险评估。这些优势使得机器学习在债券市场中的应用不仅提高了预测的准确性,还能够更好地应对市场的动态变化和复杂性,从而成为传统违约模型的有效补充。
为了便于读者理解报告的内容,我们在开篇首先梳理整个模型从搭建、训练到预测的过程。整个过程大致分为4步,观察真实世界中数据的分布情况并构造适应于分类学习模型的数据集,选取不同维度的因子,使用不同的分类模型(如逻辑回归、支持向量机、随机森林等)训练并测试模型,并给出最新一期的预测情况。
图表1:通用机器学习流程图
资料来源:产业金融研究院
上市公司债券信用风险识别的意义不仅仅停留在于对于债券风险的规避,其同样可以用于对上市公司股票的筛选。如果将上市公司对应的债券信用风险作为一个筛选股票池的因子的话,其同样具有良好的效果。统计2016年5月1日至2024年8月31日之间发生信用风险的债券对应的上市公司在财报截止日之间的表现(假设某支债券发生信用风险的日期为2016年5月13日,则对应的区间为2016年5月1日至2016年8月30日),以中证800作为基准,超额收益为负的占比为73.03%,超额收益的中位数为-14.18%。
这就意味着可以通过剔除预测可能发生信用风险的上市公司来进行股票策略的增强。
图表2:发生信用风险的债券对应的上市公司在财报截止日之间的表现统计
区间超额
您可能关注的文档
- 泰恩康创新药研发持续推进,特色管线不断丰富,有望迎来拐点.docx
- 天合光能光伏一体化龙头,多元化布局助力穿越周期.docx
- 天益医疗全球化布局的血液净化先行者.docx
- 通威股份成本为王,积极布局光伏一体化.docx
- 通信行业CienaFY24Q4业绩点评及业绩说明会纪要:在手订单饱满,预计2025年收入恢复增长.docx
- 万辰集团公司首次覆盖报告:切入零食量贩赛道,迈向高增长新篇章.docx
- 微软数据中心资本开支同比大幅提升,继续看好算力基建产业链.docx
- 微信小店送礼物功能持续出圈,关注春节档影片供给改善拐点.docx
- 稳健医疗医疗与消费协同发展,多点开花激荡新元年.docx
- 五个视角看当前债市性价比:债市的锚.docx
最近下载
- 惠普HP LaserJet Tank MFP 1005 打印机系列用户指南.pdf
- 【政治】传承中华优秀传统文化单元思考与行动课件-+2024-2025学年统编版道德与法治七年级下册.pptx VIP
- 硫化氢安全培训课件.pptx VIP
- 基于Web的园林花卉库存管理系统的设计与实现.docx VIP
- 规范《GB∕T3274-2017-碳素结构钢和低合金结构钢热轧钢板和钢带》.pdf
- 《超高层建筑压缩空气泡沫消火栓系统通用技术条件》.docx VIP
- 工艺技术部总结规划.pptx VIP
- 法律文书学(第三版)马宏俊-全套课件.pptx
- 详细解读消防条令.pptx VIP
- 2024江苏招生计划专刊(可搜索).pdf
文档评论(0)