基于价量数据的排序学习选股模型分析报告.pdfVIP

  • 8
  • 0
  • 约6.97万字
  • 约 20页
  • 2023-10-08 发布于广东
  • 举报

基于价量数据的排序学习选股模型分析报告.pdf

金融工程 证券研究报告 专题报告 2023 年09 月28 日 【专题报告】 基于价量数据的排序学习选股模型  排序学习的定义 排序学习(Learning to Rank ,LTR )又名“机器排序学习” (Machine-learned Ranking )是一种监督学习方法,此机器学习算法通过在数据集上对大量特征 进行训练,从而学习生成排序模型,以用于解决实际中的排序问题。排序学习 在文档检索、过滤和推荐系统等领域,已得到广泛应用。  LTR 算法演变 本文逐步介绍排序学习具体的算法演变,其中包括了,基于配对文档相对排序 相关研究报告 的概率损失函数,用数据对来训练模型的pairwise 排序学习方法RankNet 、对 《量化选股系列——机构情绪与个人情绪》 RankNet 的配对思想进行了扩展,将RankNet 中损失函数相对得分函数的梯度 2023-09-05 定义为lambda ,与整体排序的评分标准(如NDCG )进行结合的LambdaRank 、 《技术指标研究之一:重新认识技术指标》 以及我们模型中所用到的在LambdaRank 的基础上将Mart 与现有模型相结合 2023-08-21 的LambdaMart 算法。 《形态学研究之八:如何利用形态信号进行行业 择时》  模型设计 2023-08-07 在构建股票池的时候,选择了沪深300、中证500、中证1000 的历史成份股分 《K 线形态研究之七:停顿线》 2023-07-31 别作为A 股市场大盘股、中盘股、小盘股的代表构建了 1800 只股票的备选股 《K 线形态研究之六:乌云压顶线》 票池,取数时间范围为2014 年 11 月至2023 年8 月底。选股策略选取了价量 2023-07-31 数据作为模型特征的主要组成部分,其中包括了每日个股上大单、中单、小单 的流入流出数据,并在此基础上添加了一致预期数据。在进行数据处理之后, 我们对以上数据使用了不同的算子进行特征工程。  LGBMRanker 选股轮动模型回测结果 本文通过使用LGBMRanker 对沪深 300 、中证500、中证1000 的成份股进行 排序学习,构建出基于价量数据的选股模型,经回测该策略从2015 年 11 月至 2023 年 8 月底的累计绝对收益率为 167.31%,相较于等权基准,累计超额收 益率为 160.16%,年化收益率为13.28%,超额年化为12.40%,夏普比率为0.48 , 最大回撤为 34.58% 。从回测结果来看,策略相较于等权基准的年胜率为 88.89%,月胜率为 65.96% ,相较于沪深 300 的年胜率为 77.78% ,月胜率为 58.51%,相较于中证500 的年胜率为 100%,月胜率为67.02% ,相较于中证 1000 的年胜率为100%,月胜率为76.60%。策略2023 年年初至8 月底的绝对 收益率为18.10%,相较于等权基准,超额收益率为13.14%,表现出色。  风险提示: 本报告中所有统计结果和模型方法均基于历史数据,不代表未来趋势。 专题报告 投资主题

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档