- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人工智能选股之stacking集成学习.PDF
证券研究报告
金工研究/深度研究
2018 年05 月03 日
林晓明 执业证书编号:S0570516010001 人工智能选股之stacking 集成学习
研究员 0755
linxiaoming@ 华泰人工智能系列之十一
陈烨 010
联系人 chenye@ 报告使用了一种改进的Stacking 模型,适合应用于金融数据领域
Stacking 是一种常见的集成学习框架,一般有两层,其能够成功的关键在
李子钰
于第一层模型能针对原始数据得出有差异性(相关性低)且预测能力好的
联系人 liziyu@
输出值,这样通过第二层模型进一步学习后,能够在多个第一层模型中取
长补短,提升预测的准确度和稳定性。本文使用的是一种改进的Stacking
相关研究 框架,框架的第一层不仅使用不同的模型,还使用有差异的训练数据,这
进一步增大了模型输出值之间的差异性,这样的差异性往往适合于训练和
1 《金工: A 股市场及行业的农历月份效应》 预测数据不是同分布的领域,可以增强预测的稳定性,如金融数据的预测。
2018.03
2 《金工: 宏观周期指标应用于随机森林选 报告提出了基于适应度指标的Stacking 基模型选择方法
股》2018.03 对于Stacking 集成学习在多因子选股领域的应用,本文提出了基于适应度
3《金工: 2018 中国与全球市场的机会、风险》 指标的基模型选择方法,该方法本质是挑选预测值相关性低且预测能力好
2018.03 的基模型进行集成。通过分析,我们认为使用6 个月数据训练的XGBoost
模型(XGBoost_6m )以及逻辑回归模型(逻辑回归_6m )最适合与使用
72 个月数据训练的XGBoost (XGBoost_72m )进行Stacking 集成。
报告给出了Stacking 应用于多因子选股的3 个关键结论
对于Stacking 集成学习在多因子选股领域的应用,我们通过对比测试,得
出以下结论:(1)Stacking 第一层应该使用不同种类的基模型和训练数据
以达到最好的预测结果;(2)Stacking 第一层并非集成越多的基模型表现
就越好,要达到更好的集成学习效果,需要各个基模型两两之间相关性低,
且基模型有足够好的预测能力。(3)较短的验证集数据长度(2 个月)可
以使得Stacking 集成学习模型的超额收益最大回撤较小,Calmar 比率较
高,模型预测值的IR 比率较高。
Stacking 模型能获得较高的超额收益并控制回撤,Calmer 比率提升显著
在本文的测试中,最优的Stacking 集成学习模型为将XGBoost_72m 和逻
辑回归_6M 进行集成,并且验证集数据选用2 个月的模型(以下简称最优
模型)。最优模型有效结合了基模型的优点(XGBoost_72m 的高收益、高
信息比率,逻辑回归_6m 的低回撤)。2011 年2 月至2018 年4 月,对于
您可能关注的文档
- METAv5.3.8.0Introductionof-硬件和射频工程师.PDF
- Oracle高级供应链计划.PDF
- PCT专利审查高速路(PCT-PPH)试点项目WIPO优先权文件数字存取服务.PDF
- Picasa整理、编辑、分享相片的好帮手.ppt
- PingPangRoll一种基于乒乓映射的P2P资源发现方法-Read.PDF
- 稠油油田高含水期剩余油分布规律及挖潜策略.PDF
- Praxis项目文献6非洲谚语在组织能力建设中的应用Chiku-INTRAC.PDF
- PSOLDA以粒子群优化法加强线性判别分析的准确率.PDF
- SCOPE计画亲子卫星&観测机器(笠羽)-ISAS.ppt
- 线外剪接(Off-LineEditing)VS线上剪接(On-Line.ppt
原创力文档


文档评论(0)