- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
目录
从批量学习到增量学习 3
传统的批量学习法 3
增量学习法 4
元增量学习—双步适应训练框架 7
增量学习存在问题 7
MAML元学习 8
DA双步适应训练框架 9
元增量学习对传统深度学习模型的增强 13
LSTM模型 13
GRU模型 16
总结对比 20
总结与思考 21
风险提示 22
参考文献 23
插图目录 24
表格目录 24
从批量学习到增量学习
传统的批量学习法
传统的批量学习法存在一定改进空间。在传统的深度学习方法中,我们常用批量学习,即滚动训练(RollingRetraining,RR)来进行模型的训练与预测。在这样的框架中,我们常用某固定时间框架的训练数据进行训练与验证,并用未来的一段时间进行预测。下图是批量学习方法的示意。一般来说,在股票历史回测的框架内,因为深度学习计算效率与消耗资源较大,我们常用每半年至一年训练一次模型的方式进行滚动训练与预测,并且用最近一年左右的时间作为验证集。这就导致大多时候,模型无法获取最新数据进行训练,即模型无法包含最近数据分布的信息。且若训练数据随时间增长,模型参数较多,模型计算效率将更加缓慢,超参数的搜索过程将耗费大量时间与资源。
图1:传统批量学习法示意
资料来源:
一个典型的批量学习法的数据处理与模型细节如下,下文中,若无特殊说明,我们仍沿用相同的数据与模型设定。本文中的数据处理与模型结构都参考了微软深度学习开源量化金融平台qlib中的设置,因参考论文(LifanZhao,etal(2023),后文中有详细说明)中选用的数据集为qlib中的alpha360,即过去60个交易日的高开低收价格数据以及成交量和均价,我们也选取这6个变量,并在此基础上增加成交额,来进行深度学习的模型搭建。批量学习第一次训练,训练集取2010-2014年,验证集2015年,测试集2016年,随后每年滚动训练一次,预测下一年的因子值。
特征X:中证500过去60个交易日的高、开、低、收、成交额、成交量、VWAP,维度为(n,60,
特征X:中证500过去60个交易日的高、开、低、收、成交额、成交量、VWAP,维度为(n,60,7)特征处理 特征处理:对过去60日的量价指标除以最新一天的值
标签y:个股相对中证500七个交易日open-to-open超额收益,T+1-T+8
LSTM:input_size=7,hidden_size=64,num_layers=2模型结构 Dropout:dropout概率为0.1
MLP:全连接层,输入维度64,输出维度1
损失函数:MSE
训练参数 batch_size:20天样本数据即8000-10000;epoch:100,早停:20,
学习率:0.001,优化器:Adam
资料来源:
在这样的训练框架下,LSTM模型输出的因子在2016年-2023年在中证500
内的周度RankIC均值为0.036,ICIR0.48,表现一般。
图3:批量学习的LSTM基准模型表现
资料来源:,
增量学习法
基于批量学习的上述问题,有些研究者则开始使用增量学习的方法来进行股票模型的训练。增量学习是指在现有模型的基础上,通过加入新的数据来更新模型的过程。与传统的批量学习不同,增量学习可以更好地适应数据的变化,同时也更加高效,因为只需要处理新增的数据而无需重新训练整个模型。在股票趋势预测的增量学习中,我们通过一系列增量任务来逐步更新模型参数。在每个任务中,我们使用增量数据来微调模型参数,并在测试数据上进行预测并评估模型性能。在示意图中,我们每过r日即可以建立一个新的增量学习任务,在下文中,若无特殊说明,我们取r=20。
图4:增量学习数据集结构
资料来源:
增量学习有很多类别,本篇研究的基准为微调(fine-tuning)类增量学习。它分为2个步骤,离线学习(offline-training)和在线推断(online-inference)。离线学习数据窗口对应上图中T日之前,包含训练集与验证集。在离线学习中,我们首先训练一个基模型,如LSTM。训练方式与批量训练类似,但在训练集中,我们不再固定batchsize,而是用20个交易日的样本为一个batch。而在验证集中,我们将验证集的样本同样分为多份20个交易日的验证子集,对于每份验证
子集,我们都用上20个交易日的样本在基模型上进行微调,随后用微调后的模型预测这一子集的股票收益。最后取所有验证子集的平均IC作为衡量验证集表现的指标。具体地,以中证500成分股为例,对于每次epoch,我们进行如下训练:
图5:离线学习部分训练结构
资料来源:
离
您可能关注的文档
- 白酒行业春节跟踪动销回暖趋势向好,内部分化态势依旧.docx
- 板块配置月报:现金流上行,折现率下行,2月建议配置周期上游、周期中游板块.docx
- 部分海外半导体设备&零部件公司财报出炉,复苏出现积极信号.docx
- 半导体行业深度:市场回暖叠加HPC题材刺激,封装迎投资机遇.docx
- 半导体行业深度报告(九):历周期模拟芯片稳中维良,拓新域国内厂商辟土开疆.docx
- 半导体行业月报:全球半导体月度销售额继续同环比增长,关注MR产业链.docx
- 保险业深度报告:供需推动寿险回暖,“市值考核”催化估值提升.docx
- 北交所策略2023年我国乘用车市场形势逐渐好转,北交所聚集一批特色汽车产业链公司.docx
- 北交所920代码号段启动仿真测试,转板机制有望迎来实质性进展.docx
- 2023年半导体行业由低谷持续复苏,北交所包含材料、测试、设备等优质公司.docx
- 基于人工智能教育平台的移动应用开发,探讨跨平台兼容性影响因素及优化策略教学研究课题报告.docx
- 高中生物实验:城市热岛效应对城市生态系统服务功能的影响机制教学研究课题报告.docx
- 信息技术行业信息安全法律法规研究及政策建议教学研究课题报告.docx
- 人工智能视角下区域教育评价改革:利益相关者互动与政策支持研究教学研究课题报告.docx
- 6 《垃圾填埋场渗滤液处理与土地资源化利用研究》教学研究课题报告.docx
- 小学音乐与美术教师跨学科协作模式构建:人工智能技术助力教学创新教学研究课题报告.docx
- 《航空航天3D打印技术对航空器装配工艺的创新与效率提升》教学研究课题报告.docx
- 教育扶贫精准化策略研究:人工智能技术在区域教育中的应用与创新教学研究课题报告.docx
- 《区块链技术在电子政务电子档案管理中的数据完整性保障与优化》教学研究课题报告.docx
- 《中医护理情志疗法对癌症患者心理状态和生活质量提升的长期追踪研究》教学研究课题报告.docx
文档评论(0)