机器学习系列之五:GSM-Alpha,提取时序特征的统一框架-240603-东北证券-30页.pdf

机器学习系列之五:GSM-Alpha,提取时序特征的统一框架-240603-东北证券-30页.pdf

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

[Table_Info1][Table_Date]

证券研究报告发布时间:2024-06-03

[Table_Title][Table_Invest]

证券研究报告/金融工程研究报告

GSM-Alpha:提取时序特征的统一框架

机器学习系列之五

报告摘要:

GSM-Alpha月度五分组回测结果

[Table_Summary]

GeneralizedSignatureMethod(GSM)是一种对多变量时间序列特征提

取的一般化方法。其架构主要包含四个部分:数据增强、窗口设定、特

征提取、尺度放缩。其中数据增强主要有三种作用,分别是敏感性引入、

降维以及新信息引入,不同的增强方式实现不同的功能,数据增强可以

使得算法更高效地提取序列信息,降维方法在变量维数较高的场景中效

果明显。窗口设定主要是对序列的划分,使得算法可以从全局、局部、

增量信息、不同尺度与层次等多个方面提取子序列信息。特征提取主要

包括Signature与Log-signature这两种方法,其可以将时间序列信息转化

[Table_Report]

为一个截面的特征集,信息转化效率高,另外唯一性与线性估计性等良相关报告

好的性质使得Signature成为机器学习任务的重要特征集;Log-signature《低波异象在可转债市场的实证研究与应用》

相对于Signature含有的信息相同但其特征数量更少。GSM可以作为深-

度学习架构中的一部分,其可以实现梯度传导且支持GPU加速,大幅提《基于波动率交易逻辑的行业轮动》

升了对高频数据流的处理效率。尺度放缩是对序列或特征进行数量级的

-

调整的一种方法,希望提升后续模型的训练效果。

《扩展长短期记忆网络xLSTM》

GSM具有较强的灵活性,具有相当多的变体可以适应不同的任务,并且-

可以融入到任意的网络架构中处理多变量的高频序列。由于Signature与《行业指数及成分股价格数据中的行业轮动信

Log-signature特征数量与序列长度无关,这使其可以处理神经网络难以息》

处理的高频、不规则采样等类型的序列。另外报告中介绍了一组综合最-

优的设定选择,来自于文献在26个数据集上的实验结果,可以作为GSM《上月Beta、波动率、红利因子表现较优》

设定的先验知识。

-

GSM-Alpha将GSM与两个神经网络模块相结合,分别实现了时序特征

提取、特征间的混合以及股票间关联信息的挖掘。整个架构的模块间实[Table_Author]

现残差链接。对比实验结果表明元素投影的降维方法效果好于可学习的

证券分析师:王琦

方法,股票间信息混合提供了信息增益,日频序列信息与分钟级序列数执业证书编号:S0550521100001

据相结合得到的因子alpha提升明显。全市场2018年1月至2024年5021wangqi_

您可能关注的文档

文档评论(0)

std85 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档