从增量学习到元学习：深度学习训练新框架.docxVIP

下载本文档

13
0
约1.52万字
约 23页
2024-02-29 发布于北京
举报
版权申诉

从增量学习到元学习：深度学习训练新框架.docx

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

从批量学习到增量学习 3

传统的批量学习法 3

增量学习法 4

元增量学习—双步适应训练框架 7

增量学习存在问题 7

MAML元学习 8

DA双步适应训练框架 9

元增量学习对传统深度学习模型的增强 13

LSTM模型 13

GRU模型 16

总结对比 20

总结与思考 21

风险提示 22

参考文献 23

插图目录 24

表格目录 24

从批量学习到增量学习

传统的批量学习法

传统的批量学习法存在一定改进空间。在传统的深度学习方法中，我们常用批量学习，即滚动训练（RollingRetraining,RR）来进行模型的训练与预测。在这样的框架中，我们常用某固定时间框架的训练数据进行训练与验证，并用未来的一段时间进行预测。下图是批量学习方法的示意。一般来说，在股票历史回测的框架内，因为深度学习计算效率与消耗资源较大，我们常用每半年至一年训练一次模型的方式进行滚动训练与预测，并且用最近一年左右的时间作为验证集。这就导致大多时候，模型无法获取最新数据进行训练，即模型无法包含最近数据分布的信息。且若训练数据随时间增长，模型参数较多，模型计算效率将更加缓慢，超参数的搜索过程将耗费大量时间与资源。

图1：传统批量学习法示意

资料来源：

一个典型的批量学习法的数据处理与模型细节如下，下文中，若无特殊说明，我们仍沿用相同的数据与模型设定。本文中的数据处理与模型结构都参考了微软深度学习开源量化金融平台qlib中的设置，因参考论文（LifanZhao,etal(2023)，后文中有详细说明）中选用的数据集为qlib中的alpha360，即过去60个交易日的高开低收价格数据以及成交量和均价，我们也选取这6个变量，并在此基础上增加成交额，来进行深度学习的模型搭建。批量学习第一次训练，训练集取2010-2014年，验证集2015年，测试集2016年，随后每年滚动训练一次，预测下一年的因子值。

特征X：中证500过去60个交易日的高、开、低、收、成交额、成交量、VWAP，维度为(n,60,

特征X：中证500过去60个交易日的高、开、低、收、成交额、成交量、VWAP，维度为(n,60,7)特征处理特征处理：对过去60日的量价指标除以最新一天的值

标签y：个股相对中证500七个交易日open-to-open超额收益，T+1-T+8

LSTM：input_size=7,hidden_size=64,num_layers=2模型结构 Dropout：dropout概率为0.1

MLP：全连接层，输入维度64，输出维度1

损失函数：MSE

训练参数 batch_size:20天样本数据即8000-10000；epoch：100，早停：20，

学习率：0.001，优化器：Adam

资料来源：

在这样的训练框架下，LSTM模型输出的因子在2016年-2023年在中证500

内的周度RankIC均值为0.036，ICIR0.48，表现一般。

图3：批量学习的LSTM基准模型表现

资料来源：，

增量学习法

基于批量学习的上述问题，有些研究者则开始使用增量学习的方法来进行股票模型的训练。增量学习是指在现有模型的基础上，通过加入新的数据来更新模型的过程。与传统的批量学习不同，增量学习可以更好地适应数据的变化，同时也更加高效，因为只需要处理新增的数据而无需重新训练整个模型。在股票趋势预测的增量学习中，我们通过一系列增量任务来逐步更新模型参数。在每个任务中，我们使用增量数据来微调模型参数，并在测试数据上进行预测并评估模型性能。在示意图中，我们每过r日即可以建立一个新的增量学习任务，在下文中，若无特殊说明，我们取r=20。

图4：增量学习数据集结构

资料来源：

增量学习有很多类别，本篇研究的基准为微调（fine-tuning）类增量学习。它分为2个步骤，离线学习（offline-training）和在线推断（online-inference）。离线学习数据窗口对应上图中T日之前，包含训练集与验证集。在离线学习中，我们首先训练一个基模型，如LSTM。训练方式与批量训练类似，但在训练集中，我们不再固定batchsize，而是用20个交易日的样本为一个batch。而在验证集中，我们将验证集的样本同样分为多份20个交易日的验证子集，对于每份验证

子集，我们都用上20个交易日的样本在基模型上进行微调，随后用微调后的模型预测这一子集的股票收益。最后取所有验证子集的平均IC作为衡量验证集表现的指标。具体地，以中证500成分股为例，对于每次epoch，我们进行如下训练：

图5：离线学习部分训练结构

资料来源：

离

从增量学习到元学习：深度学习训练新框架.docx 原文免费试下载