融合年报文本语义信息的财务困境预测研究.pdfVIP

下载本文档

10
0
约8.19万字
约 43页
2023-02-04 发布于江苏
举报

融合年报文本语义信息的财务困境预测研究.pdf

ABSTRACT 2020 年，北大方正等国有企业发生信用债违约和永续债展期后，一石激起千层浪，恶性信用违约迅速扩散至数十家国有企业。在信用市场面临严峻考验的同时，财务困境预测成为了决策者和学者关注的重点研究方向。为了更全面地考察上市公司的财务状况，除了财务数据以外，以“管理层讨论与分析” （MDA ）为代表的上市公司披露文本也引起了学者的广泛关注。目前，多数相关研究从文本披露指标或特征词频的角度量化了MDA 文本信息，并且证明了融入文本信息能够提升模型对财务困境预测的准确率。但是，无论是文本披露指标还是特征词频，都舍弃了文本中的有效语义信息，导致融合文本信息对财务困境预测效果的提升程度相对有限。为了进一步提升模型对财务困境预测的准确率，本文提出了 BERT+HAN 模型对 MDA 的语义信息进行量化分析，结合语义信息和财务数据预测上市公司财务困境。本文首先使用了微调后的预训练模型 BERT 对原文进行逐字嵌入，获得了包含大量语义信息的字向量，随后设计了带有分层自注意力机制的神经网络(HAN)，先后在“字” 和“句” 的层面提取文本的有效信息，逐步将全文的字向量转换成若干句向量和最终的文本向量，再通过神经网络的全连接层结合文本向量和财务指标预测财务困境。与使用文本披露指标或特征词频表示的文本信息相比，通过预训练模型得到的文本向量保留了原始文本的大量语义信息。同时，分层自注意力机制实现了对重点语义信息的分步萃取，因此， BERT+HAN 模型中的文本向量只包括了与财务困境预测相关的最有效信息，对财务困境预测的效果更佳。本文以 2012-2020 年中国沪深两市 A 股上市公司为研究对象，以未来一至两年内被沪深交易所冠以“ST”的上市公司作为财务困境样本，结合财务指标分别以文本披露指标、特征词频和语义文本向量表示文本信息预测财务困境。实验对比了基准文本挖掘方法+经典机器学习模型和 BERT+HAN 模型对财务困境的预测效果。实验结果表明，相较于基准模型中表现最佳的特征词频+极端梯度（XGBoost ）提升模型，融合了文本语义信息的BERT+HAN 模型对上市公司财务困境预测的AUC 值提升了 1.03%，对财务困境样本的召回率提升了 2.39% 。另外，本文设计的分层自注意力机制可以通过权重矩阵量化文本中各词句对财务困境预测的重要性，可以实现对文本重要信息的智能标注。相关决策人员可以据此直接参考 MDA 披露的重点信息。财务困境；深度学习；文本分类；注意力机制 IV 融合年报文本信息的财务困境预测研究第一章绪论 ··································································· 第一节研究背景与研究意义 ····························································· 一、研究背景 ·············································································· 二、研究意义 ·············································································· 2 第二节文献综述 ··············································

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

融合年报文本语义信息的财务困境预测研究.pdfVIP