文本FADT选股报告.pdfVIP

  • 20
  • 0
  • 约16.4万字
  • 约 31页
  • 2022-07-17 发布于新疆
  • 举报
金工研究 研究导读 Mark Minervini 在《股票魔法师》中提出过一个观点:明星股票的背后大多数都存在着某种 “催化剂”事件,这些催化剂事件可能是连续靓眼的业绩、某款热销产品的出现,可能是 新合同的签订,甚至可能是新CEO 的任职。这些“催化剂”事件使得那些默默无闻、不为 人知的股票开始得到机构投资者的关注,从而有机会向明星股票迈进。本文受上述观点启 发,希望能找到对股价正向影响较大的 “催化剂”,那么从量化的视角来看,有没有某种方 法能对类似的“催化剂”事件进行监测?分析师盈利预测及评级调整或是一条可能的路径。 本文是华泰金工人工智能系列文本挖掘主题的第五篇报告,我们继续将视野聚焦于分析师 研报文本,探究分析师盈利预测及评级调整这一场景下研报文本中的情感识别。本文的研 究动机如上所述,我们希望找到对股价具有正向影响的 “催化剂”事件,并将其数量化。 由于“催化剂”没有某种特定的模式,不同的行业“催化剂”事件可能千差万别,如果从 遍历的思路出发很难对所有事件进行系统监测。 现在我们尝试从另一个角度出发进行研究。由于行业研究员对个股进行覆盖,对个股的跟 踪及时性更强,当个股出现了影响较大的“催化剂”事件以后,分析师大多会及时撰写点 评报告,并可能对盈利预测及评级进行调整。这为我们提供了监测“催化剂”事件的间接 思路,因此我们可以将目标转换为对分析师盈利预测及评级调整的研报文本进行情感识别, 进而找出正向催化较强的个股。 参考前期报告 《人工智能51:文本PEAD 选股策略》中对分析师业绩点评研 报文本的研究思路,我们对盈利预测及评级调整的研报文本使用类似的方法论进行挖掘。 令研报文本用词的词频矩阵作为输入特征,分析师研报发布前后两天的个股超额收益作为 预测标签,使用机器学习模型进行交叉验证训练,在样本外根据模型预测得分构建 forecast_adj_txt 因子,该因子十层严格单调,多头端收益显著,且与传统的 forecast_adj 因子相关性较低。 在正文中我们花了比较多的篇幅来讨论整个模型构建过程中的参数敏感性问题,核心结论 是:文本因子的构建基本不存在人为过度调参导致的过拟合问题,模型参数稳健性较高, 分析师盈利预测调整研报文本的情感识别是信噪比较低且规律不易随时间改变的场景。在 测试过程中,我们主要讨论了以下参数:训练使用的非线性模型、研报标题和摘要采用的 词数、样本内窗口长度、样本标签的时间区间、标签分类数量等。 5 金工研究 图表1: FADT 选股组合回测净值 图表2: FADT 选股组合相对中证500 超额净值 最大回撤(右轴) 增强组合回测净值 超额最大回撤(右轴) 相对中证500净值 140 0% 50 0%

文档评论(0)

1亿VIP精品文档

相关文档