融合年报文本语义信息的财务困境预测研究.pdfVIP

  • 10
  • 0
  • 约8.19万字
  • 约 43页
  • 2023-02-04 发布于江苏
  • 举报

融合年报文本语义信息的财务困境预测研究.pdf

ABSTRACT 2020 年,北大方正等国有企业发生信用债违约和永续债展期后,一石激起千层 浪,恶性信用违约迅速扩散至数十家国有企业。在信用市场面临严峻考验的同时,财 务困境预测成为了决策者和学者关注的重点研究方向。为了更全面地考察上市公司的 财务状况,除了财务数据以外,以“管理层讨论与分析” (MDA )为代表的上市公司 披露文本也引起了学者的广泛关注。目前,多数相关研究从文本披露指标或特征词频 的角度量化了MDA 文本信息,并且证明了融入文本信息能够提升模型对财务困境 预测的准确率。但是,无论是文本披露指标还是特征词频,都舍弃了文本中的有效语 义信息,导致融合文本信息对财务困境预测效果的提升程度相对有限。 为了进一步提升模型对财务困境预测的准确率,本文提出了 BERT+HAN 模型对 MDA 的语义信息进行量化分析,结合语义信息和财务数据预测上市公司财务困境。 本文首先使用了微调后的预训练模型 BERT 对原文进行逐字嵌入,获得了包含大量语 义信息的字向量,随后设计了带有分层自注意力机制的神经网络(HAN),先后在“字” 和“句” 的层面提取文本的有效信息,逐步将全文的字向量转换成若干句向量和最终的 文本向量,再通过神经网络的全连接层结合文本向量和财务指标预测财务困境。与使 用文本披露指标或特征词频表示的文本信息相比,通过预训练模型得到的文本向量保 留了原始文本的大量语义信息。同时,分层自注意力机制实现了对重点语义信息的分 步萃取,因此, BERT+HAN 模型中的文本向量只包括了与财务困境预测相关的最有 效信息,对财务困境预测的效果更佳。 本文以 2012-2020 年中国沪深两市 A 股上市公司为研究对象,以未来一至两年 内被沪深交易所冠以“ST”的上市公司作为财务困境样本,结合财务指标分别以文本披 露指标、特征词频和语义文本向量表示文本信息预测财务困境。实验对比了基准文本 挖掘方法+经典机器学习模型和 BERT+HAN 模型对财务困境的预测效果。实验结果 表明,相较于基准模型中表现最佳的特征词频+极端梯度(XGBoost )提升模型,融合 了文本语义信息的BERT+HAN 模型对上市公司财务困境预测的AUC 值提升了 1.03%, 对财务困境样本的召回率提升了 2.39% 。另外,本文设计的分层自注意力机制可以通 过权重矩阵量化文本中各词句对财务困境预测的重要性,可以实现对文本重要信息的 智能标注。相关决策人员可以据此直接参考 MDA 披露的重点信息。 财务困境;深度学习;文本分类;注意力机制 IV 融合年报文本信息的财务困境预测研究 第一章 绪论 ··································································· 第一节 研究背景与研究意义 ····························································· 一、研究背景 ·············································································· 二、研究意义 ·············································································· 2 第二节 文献综述 ··············································

文档评论(0)

1亿VIP精品文档

相关文档