- 10
- 0
- 约8.19万字
- 约 43页
- 2023-02-04 发布于江苏
- 举报
ABSTRACT
2020 年,北大方正等国有企业发生信用债违约和永续债展期后,一石激起千层
浪,恶性信用违约迅速扩散至数十家国有企业。在信用市场面临严峻考验的同时,财
务困境预测成为了决策者和学者关注的重点研究方向。为了更全面地考察上市公司的
财务状况,除了财务数据以外,以“管理层讨论与分析” (MDA )为代表的上市公司
披露文本也引起了学者的广泛关注。目前,多数相关研究从文本披露指标或特征词频
的角度量化了MDA 文本信息,并且证明了融入文本信息能够提升模型对财务困境
预测的准确率。但是,无论是文本披露指标还是特征词频,都舍弃了文本中的有效语
义信息,导致融合文本信息对财务困境预测效果的提升程度相对有限。
为了进一步提升模型对财务困境预测的准确率,本文提出了 BERT+HAN 模型对
MDA 的语义信息进行量化分析,结合语义信息和财务数据预测上市公司财务困境。
本文首先使用了微调后的预训练模型 BERT 对原文进行逐字嵌入,获得了包含大量语
义信息的字向量,随后设计了带有分层自注意力机制的神经网络(HAN),先后在“字”
和“句” 的层面提取文本的有效信息,逐步将全文的字向量转换成若干句向量和最终的
文本向量,再通过神经网络的全连接层结合文本向量和财务指标预测财务困境。与使
用文本披露指标或特征词频表示的文本信息相比,通过预训练模型得到的文本向量保
留了原始文本的大量语义信息。同时,分层自注意力机制实现了对重点语义信息的分
步萃取,因此, BERT+HAN 模型中的文本向量只包括了与财务困境预测相关的最有
效信息,对财务困境预测的效果更佳。
本文以 2012-2020 年中国沪深两市 A 股上市公司为研究对象,以未来一至两年
内被沪深交易所冠以“ST”的上市公司作为财务困境样本,结合财务指标分别以文本披
露指标、特征词频和语义文本向量表示文本信息预测财务困境。实验对比了基准文本
挖掘方法+经典机器学习模型和 BERT+HAN 模型对财务困境的预测效果。实验结果
表明,相较于基准模型中表现最佳的特征词频+极端梯度(XGBoost )提升模型,融合
了文本语义信息的BERT+HAN 模型对上市公司财务困境预测的AUC 值提升了 1.03%,
对财务困境样本的召回率提升了 2.39% 。另外,本文设计的分层自注意力机制可以通
过权重矩阵量化文本中各词句对财务困境预测的重要性,可以实现对文本重要信息的
智能标注。相关决策人员可以据此直接参考 MDA 披露的重点信息。
财务困境;深度学习;文本分类;注意力机制
IV
融合年报文本信息的财务困境预测研究
第一章 绪论 ···································································
第一节 研究背景与研究意义 ·····························································
一、研究背景 ··············································································
二、研究意义 ·············································································· 2
第二节 文献综述 ··············································
您可能关注的文档
最近下载
- 2023-2024学年江苏省南通市如皋市高二(上)调研英语试卷(一).doc VIP
- 职业病防治法题库.doc VIP
- 传承红色英雄精神PPT模板长征延安红船精神革命教育故事PPT课件两弹一星精神 (5).pptx VIP
- 2026高职第三学年(助产精英实训)高端产科护理实操员资格考核试题及答案.doc VIP
- 客户经理述职报告范文 客户经理工作述职 (16篇).docx VIP
- 高效时间规划与目标实现策略.pptx VIP
- 公共营养师基础知识完整版.pdf VIP
- 电子钱包 APP-钱Bag.PDF VIP
- 天津大学2024-2025学年《马克思主义基本原理概论》期末考试试卷(A卷)含参考答案.docx
- 提高大小便留取率的持续质量改进.ppt VIP
原创力文档

文档评论(0)