Alpha掘金系列之十九:基于Mamba2模型的端到端选股框架-251125-国金证券.pdfVIP

Alpha掘金系列之十九:基于Mamba2模型的端到端选股框架-251125-国金证券.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

从SSM,Mamba到Mamba2模型

本文创新性地将Mamba-2模型加入整体模型架构,该模型通过SSD把SSM计算重写为矩阵乘+少量结构化算子,既继

承Mamba的“选择性状态压缩”,又在系统层面获得与GPU硬件高度匹配的输入输出优势,形成“表达力-效率-可扩

展性”的三重平衡。对需要超长上下文、吞吐敏感且部署成本受限的应用场景(语音/时间序列/金融高频等),Mamba-

2提供了优于纯注意力与传统RNN/SSM的解法与性价比。

Mamba2模型与GRU选股效果比较

我们分别选取了10分钟、30分钟、60分钟、一日四种不同频率的基础量价数据,在相同数据与回测框架下,对比

Mamba2与经典GRU模型的选股效果。结果表明,Mamba2模型只有在日频数据上整体表现明显优于GRU模型,60分钟

频上与GRU模型不分伯仲,30分钟频上能够带来沪深300的优化。但相关性测算显示GRU与Mamba2在不同频率的

“截面信号”相关性约70%–80%,这意味着二者并非冗余:通过模型-频率的合成(如日频+60分/30分、GRU+Mamba2)

有望带来增量信息与风格分散。

模型合成与宽基指增策略

在构建模型前,我们构造了三类个股不变的市场信息(三大宽基指数点位、当前交易日的时间信息、基于Barra因子

构建的市场风格指数)作为附加输入。结果显示:三大宽基指数信息的提升最为显著,IC、多头多空收益与回撤指标

均明显改善;时间信息与Barra风格信息在GRU上并未带来稳定增益。

根据以上所有探讨,我们构建了“GRU(4频)+Mamba2(3频)+GJQuant因子→LGBM”的二层合成架构,并在GRU4频

输入基础上引入三大宽基指数点位信息。从合成结果看,加入Mamba2后IC、多头超额等维度表现较之GRU基线提升

明显,再叠加LGBM进一步提升;当三者联合并引入GJQ因子库后,各个维度表现进一步提升至最佳。更关键的是,

多空年化收益率与夏普比率在合成后持续抬升,而多空波动率并未同步放大,说明合成带来了真实Alpha增量而非来

源于杠杆放大。

据此搭建的三大宽基的指数增强策略均取得显著超额,沪深300、中证500、中证1000指增策略的年化超额分别达到

9.99%、12.20%和20.65%,信息比率分别为1.88、2.24和3.31;最大回撤方面,三者的主动层回撤均显著小于指数

本身。总体来说,合成架构表现优异。

风险提示

1、以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。

2、策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出

现亏损。

敬请参阅最后一页特别声明1

扫码获取更多服务

金融工程专题报告

内容目录

一、从SSM,Mamba到Mamba2模型4

1.1结构化状态空间模型(SSM):从连续系统到可并行计算4

1.2Mamba:选择性SSM与RNN/Transformer之间的效率-效果折衷4

1.3Mamba-2:以SSD(半可分离矩阵)实现张量并行友好的SSM5

二、Mamba2模型与GRU选股效果比较6

三、模型合成与宽基指增策略11

3.1引入3种市场整体信息11

3.2收益率长尾分布与损失函数的选择13

3.3模型合成框架:频率×模型×传统因子三线并进14

3.4宽基指数增强策略16

总结17

风险提示18

图表目录

图表1:结构化状态空间模型(SSM)4

图表2:结构化状态空间模型图解4

图表3:离散化的状态空间模

您可能关注的文档

文档评论(0)

专注于金融公司,实体制造业,销售代理公司的企业文化和实体项目或者互联网项目的策划编写润色,曾经协助多家基金公司,保险代理公司,房地产代销公司等初创企业完成企业文化和人事营销等制度的编写,由于疫情影响离开了喜欢的首都。

1亿VIP精品文档

相关文档