基于残差网络的端到端因子挖掘模型分析报告.pdf

基于残差网络的端到端因子挖掘模型分析报告.pdf

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
金融工程 | 专题报告 报告发布日期 2023 年08 月24 日 基于残差网络的端到端因子挖掘模型 ——因子选股系列之九十六 研究结论 ⚫ 本文我们提出了一个基于残差网络的两阶段因子挖掘模型,通过构造数据图片并使 用残差网络进行时间截面特征提取,之后再输入循环神经网络进行时序特征提取, 这样能有效的捕捉长周期信息且不会付出较大的计算代价。 ⚫ 本文将原始日内分钟线和周度内日k 线构造的数据图片集分别称之为msnew和week 数据集,并将这两个数据集分别直接输入模型采用将原始数据直接作为输入来获取 该数据集打分。这种做法完全实现端到端的模式可以有效的缓解信息丢失问题,并 且也解决了人工筛选特征带来的过拟合问题。 ⚫ 数据集 msnew 与数据集 ms 生成的因子之间信息重叠度较高但仍然存在差异。主要 原因在于数据集 msnew 使用的是半小时 k 线数据作为输入,而数据集 ms 则是根据 基于循环神经网络的多频率因子挖掘:— 2023-06-06 —因子选股系列之九十一 五分钟k 线人工构建的日频特征,二者原始数据信息天然存在差异; 多模型学习量价时序特征:——因子选股 2022-06-12 ⚫ 数据集msnew 生成打分的选股能力整体略高于数据集ms 。通过将数据集msnew 生 系列之八十三 成的弱因子替代数据集ms 参与非线性加权得到的打分在四个股票池上表现并没有发 周频量价指增模型:——因子选股系列之 2022-03-28 生较大改变,这说明数据集msnew 对数据集ms 有较好的替代性。 八十一 ⚫ 数据集week 上生成因子选股能力显著好于数据集day ,说明更长时序作为输入对未 来收益率的预测能力更强。并且通过引入week 数据集,非线性加权打分在各股票池 上的各项选股指标均有显著的提升,说明数据集week 能够对整体模型起到一个较大 的增量作用。 ⚫ 我们提出的两种不同数据集组合 Model3 和 Model4 非线性加权打分在中证全指、沪 深 300 、中证 500 、中证 1000 四个指数上十日 RankIC 均值分别为 14.97% 、 9.57% 、11.29% 、14.63%和 14.99% 、9.36% 、11.98% 、14.57% ,top 组年化超额 分别为 4 1.48% 、26.02% 、21.28% 、35.02%和 4 1.76% 、25.58% 、21.67% 、 34.56% ,打分市值偏向性较低。 ⚫ 以上两个打分也可直接应用于指数增强策略,各宽基指数上均能获得显著的超额收 益,在成分股不低于 80%限制、周单边换手率约束为 20%约束下,2018 年以来, Model3 打分在沪深 300 、中证500 和中证 1000 增强策略上年化超额收益率分别为 14.49%、19.76%和29.41% ,Model4 打分在沪深300 、中证500 和中证 1000 增强 策略上年化超额收益率分别为14.76%、20.15%和28.72% 。 风险提示 ⚫ 量化模型失效 ⚫ 极端市场造成冲击,导致亏损 金融工程 | 专题报告—— 基于残差网络的端到端因子挖掘模型 目 录 引言4 一、因子提取单元网络结构5 1.1 残差网络(Residual Networks ResNet )概述5 1.2 数据图片以及数据集的构造6 1.3 本文使用特征提取的网络架构6 二、因子分析8 2.1 各数据集选股效果分析8 2.2 各数据集打分与常见量价因子相关性分析9 三、各数

您可能关注的文档

文档评论(0)

anhuixingxing + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档