人工智能选股之朴素贝叶斯模型-DataYes.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人工智能选股之朴素贝叶斯模型-DataYes

证券研究报告 金工研究/深度研究 2017 年08 月17 日 林晓明 执业证书编号:S0570516010001 人工智能选股之朴素贝叶斯模型 研究员 0755 linxiaoming@ 华泰人工智能系列之四 陈烨 010 联系人 chenye@ 本报告对朴素贝叶斯模型及线性判别分析、二次判别分析进行系统测试 “生成模型”是机器学习中监督学习方法的一类。与 “判别模型”学习决 相关研究 策函数和条件概率不同,生成模型主要学习的是联合概率分布 (, ) 。本 1 《金工: 基于 DDM 模型的板块轮动探索》 文中,我们从朴素贝叶斯算法入手,分析比较了几种常见的生成模型 (包 2017.08 括线性判别分析和二次判别分析)应用于多因子选股的异同,希望对本领 2 《金工: 人工智能选股之支持向量机模型》 域的投资者产生有实用意义的参考价值。 2017.08 3 《金工: 华泰价值选股之相对市盈率港股模 朴素贝叶斯模型构建细节:月频滚动训练,结合基于时间序列的交叉验证 型》2017.07 朴素贝叶斯模型的构建包括特征和标签提取、特征预处理、训练集合成和 滚动训练等步骤。我们的模型设置为月频换仓,在每个月月底重新训练并 交叉验证一次。我们采用了一种基于时间序列的交叉验证方法,其核心思 想在于,交叉验证集中的样本在时间序列上始终位于训练集样本之后,验 证时不会用到未来信息。交叉验证结果显示,训练期越长、模型预测效果 越好。最终在每个月底可以产生对全部个股下期上涨概率的预测值,然后 根据正确率、AUC 等指标以及策略回测结果对模型进行评价。 朴素贝叶斯在指数成份内选股效果较好,线性判别分析全A 选股效果较好 对于沪深 300 成份股内选股的行业中性策略(每个行业选 5 只个股),朴 素贝叶斯、线性判别分析和二次判别分析的年化超额收益率分别为7.69%、 7.89%、6.12%,信息比率为 1.84、1.77、1.50。对于中证 500 成份股内 选股的行业中性策略,三种方法年化超额收益率分别为 9.64%、8.29%、 8.13%,信息比率为2.14、2.01、1.98。对于全A 选股的行业中性策略, 三种方法相对于中证500 的年化超额收益率分别为18.9%、22.2%、20.1%, 信息比率为 3.00、3.49、3.38。总体而言,朴素贝叶斯在沪深300 和中证 500 成份内选股表现较优,线性判别分析全A 选股表现较好。 线性判别分析法的分类效果最佳,其在某种意义下等价于线性回归 经过对比,我们发现线性判别分析法的测试集正确率、AUC 普遍优于其它 算法。通过简单的计算,我们发现股票的特征因子之间存在着相关性,且 对于不同类别的股票这种相关性几乎一致,线性判别分析的假设最符合实 际情况。在二分类问题中,线性判别分析在某种意义上等价于线性回归, 所以这进一步

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档