- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
正文目录
一、多模型多数据集量价机器学习模型 4
1.1.基于日频量价的多模型Alpha框架 4
二、基于混合频率量价数据的量价因子构建 5
多频率数据集的构建和测试 5
多频率量价数据残差增量学习框架 6
三、因子分析和风格归因 12
综合量价因子的单因子测试 12
综合量价因子的风格/风险分析 13
四、策略构建和测试 15
周频指数增强策略构建测试 15
沪深300指数增强策略(周频) 16
中证500指数增强策略(周频) 17
中证1000指数增强策略(周频) 18
五、总结 19
图表目录
图1:日频机器学习综合量价因子构建流程 4
图2:不同数据集构建的量价两两相关性 4
图3:周频及15min频率量价数据构建过程 5
图4:简单混合频率量价因子构建流程 5
图5:不同频率数据构建的综合量价因子两两相关系数 6
图6:(新因子vs旧因子)多头超额净值 6
图7:Stacking方法典型算法流程 7
图8:Boosting方法典型算法流程 7
图9:基于数据集的残差增量学习框架 8
图10:基于特征的残差增量学习框架 9
图11:一个典型的GRU特征提取流程 10
图12:不同学习框架的综合因子多空组合净值对比 11
图13:不同学习框架多头超额净值对比 11
图14:综合因子分组超额年化收益率 12
图15:综合因子历史RankIC序列 12
图16:综合因子多空组合累计净值(对数坐标) 12
图17:综合因子分组超额净值(自然坐标) 12
图18:因子多头超额净值走势和动态回撤 14
图19:市值的极端暴露导致多头组合大幅回撤 14
图20:沪深300指数增强净值走势(100%成分股) 16
图21:沪深300指数增强净值走势(全市场选股) 16
图22:中证500指数增强净值走势(100%成分股) 17
图23:中证500指数增强净值走势(全市场选股) 17
图24:中证1000指数增强净值走势(100%成分股) 18
图25:中证1000指数增强净值走势(全市场选股) 18
表1:量价因子模型数据集相关固定参数说明 4
表2:不同数据集对应的量价因子表现(全A,20组) 4
表3:不同数据集构建的量价因子表现(周频,全A,20组) 5
表4:不同集成学习流程构建的量价因子表现(周频,全A,20组) 8
表5:在不同量价数据集上生成的部分因子IC统计量 10
表6:不同混合频率量价因子学习框架得到的综合因子表现 11
表7:不同成分股中的综合因子表现 12
表9:综合因子与常见风格因子的平均截面相关性 13
表10:因子多头回撤区间不同风格因子的收益率贡献 14
表11:沪深300指数增强策略分年度表现(100%成分股内选股) 16
表12:沪深300指数增强策略分年度表现(全市场选股) 16
表13:中证500指数增强策略分年度表现(100%成分股内选股) 17
表14:中证500指数增强策略分年度表现(全市场选股) 17
表15:中证1000指数增强策略分年度表现(100%成分股内选股) 18
表16:中证1000指数增强策略分年度表现(全市场选股) 18
一、多模型多数据集量价机器学习模型
1.1.基于日频量价的多模型Alpha框架
在前期报告中,我们构建了基于日频量价的机器学习模型。使用的数据主要包括:日频量价、周频量价、Alpha158因子集合。该模型利用不同的机器学习模型在单个数据集上进行学习得到对应数据集的因子,然后通过等权加权得到综合量价因子。在不同成分股内的测试结果来看,基于日频量价信息构建的因子在RankIC均值、多头超额收益率水平这些统计量上都表现稳定且良好。
名称 参数说明表1:量价因子模型数据集相关固定参数说明
名称 参数说明
股票池 全A股票,剔除上市不满三个月、ST、*ST、停牌的股票、沪深300、中证500、中证1000等数据集 日线量价数据、周频量价数据等
预测label T+1日至T+11日复权日内VWAP价格收益率
调仓周期 每周第一个交易日按照上一个交易日的因子生成持仓信息因子预处理 MAD标准化,3倍MAD以外异常值截断,缺失值填充为0Label预处理 基于风格的风险调整,label截面zscore标准化
对比基准 对应股票池的等权组合
Batch定义 一个交易日截面上所有的股票作为一个batch
数据划分20240816,滚动训练模式;在训练集中划分
文档评论(0)