AI选股模型特征筛选与处理,SHAP、中性化与另类特征.docx

AI选股模型特征筛选与处理,SHAP、中性化与另类特征.docx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

内容目录

一、为什么需要特征工程? 5

二、特征选择方法介绍 5

基础统计方法 5

SHapleyAdditiveexPlanations 6

STochasticGates(STG) 6

三、特征选择方法效果 7

基础统计方法 7

SHAP方法 8

STG方法与整体比较 10

滚动训练的必要性讨论 12

四、因子与标签中性化效果 12

五、加入另类因子的效果 13

宏观指标等截面不变的因子 13

分钟频量价数据计算的高频因子 15

六、特征工程优化的GBDT+NN指数增强策略 17

因子测试结果 18

特征工程优化的GBDT+NN的指数增强策略 20

总结 25

风险提示 25

图表目录

图表1:SHAP示意图 6

图表2:STG模型示意图 7

图表3:滚动训练数据划分 7

图表4:基础统计方法各项指标对比 8

图表5:基础统计方法多空组合净值 8

图表6:基础统计方法分位数组合年化超额收益 8

图表7:基于SHAP方法因子筛选各项指标对比 9

图表8:基于SHAP方法多空组合净值 9

图表9:基于SHAP方法分位数组合年化超额收益 9

图表10:SHAP对特定样本的解释 10

图表11:SHAP对全部样本集的解释 10

图表12:SHAP对部分样本的解释 10

图表13:STG的特征选择层门控信息 11

图表14:几种特征选择方法各项指标对比 11

图表15:几种特征选择方法多空净值曲线 11

图表16:滚动训练中选择因子的变化情况 12

图表17:GRU输入数据中性化表现 13

图表18:LightGBM输入数据中性化表现 13

图表19:各类另类因子描述 14

图表20:另类因子加入后LightGBM的表现 14

图表21:另类因子多空组合净值 14

图表22:另类因子分位数组合年化超额收益 14

图表23:国金金工基础高频因子 15

图表24:沪深300上高频因子表现 15

图表25:沪深300上高频因子多空组合净值 16

图表26:沪深300上高频因子分位数组合年化超额收益 16

图表27:中证500上高频因子表现 16

图表28:中证500上高频因子多空组合净值 16

图表29:中证500上高频因子分位数组合年化超额收益 16

图表30:中证1000上高频因子表现 17

图表31:中证1000上高频因子多空组合净值 17

图表32:中证1000上高频因子分位数组合年化超额收益 17

图表33:特征工程优化的GBDT+NN模型结构 18

图表34:特征工程优化的GBDT+NN因子在沪深300成分股的各项指标 18

图表35:GBDT+NN+FE在300上多头超额净值曲线 19

图表36:GBDT+NN+FE在300上多空净值曲线 19

图表37:特征工程优化的GBDT+NN因子在中证500成分股的各项指标 19

图表38:GBDT+NN+FE在500上多头超额净值曲线 19

图表39:GBDT+NN+FE在500上多空净值曲线 19

图表40:特征工程优化的GBDT+NN因子在中证1000成分股的各项指标 20

图表41:GBDT+NN+FE在1000上多头超额净值曲线 20

图表42:GBDT+NN+FE在1000上多空净值曲线 20

图表43:特征工程优化的GBDT+NN沪深300指数增强策略指标 21

图表44:GBDT+NN+FE在300上指增策略净值曲线 21

图表45:GBDT+NN+FE在300上指增策略超额净值曲线 21

图表46:特征工程优化的GBDT+NN沪深300指数增强策略分年度收益 21

图表47:特征工程优化的GBDT+NN沪深300指数增强策略分年度收益数值 22

图表48:特征工程优化的GBDT+NN中证500指数增强策略指标 22

图表49:GBDT+NN+FE在500上指增策略净值曲线 22

图表50:GBDT+NN+FE在500上指增策略超额净值曲线 22

图表51:特征工程优化的GBDT+NN中证500指数增强策略分年度收益 23

图表52:特征工程优化的GBDT+NN中证500指数增强策略分年度收益数值 23

图表53:特征工程优化的GBDT+NN中证1000指数

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档