行业拆分和聚类:定义配置对象.pdfVIP

  • 19
  • 0
  • 约7.11万字
  • 约 21页
  • 2022-09-02 发布于广西
  • 举报
1 投资聚焦 近年行业配置重要性逐步上升,在经济增速放缓的大背景下,行业龙头集中现象 导致了选股差异度下降,基金超额收益更多依赖行业的配置和择时。 本文作为行业配置系列研究的第一篇报告,主要目的是结合最新的产业链发展状 况对全市场股票的行业分类标准做出调整。通过将同属于一级行业的的二级子行业进 行适当地拆分,目的是为了把分化度大的行业精细化分类,减少行业配置时低相关性 的二级子行业的噪音干扰。然后用数据聚类的方法,把多个拆分后的行业标准进行板 块聚类,为行业配置策略提供高内聚的配置对象。   行业拆分部分,以申万一级行业划分为基础。从量价信息、基本面信息两个视角,   对一级行业进行分化度刻画,对分化度高的一级行业进行拆分成多个二级子行业。     行业聚类部分,用 KMeans 算法对拆分后得到的最终行业分类进行板块聚类, 并对板块进行编号进行处理。 从一级行业分化度刻画、行业拆分标准设定和行业聚类部分,全程采用的是时间 窗口移动的计算方式,并且都有明确的量化指标,几乎没有在当前时间节点对历史行 业进行主观的调整部分。 2 行业分化度刻画 2.1 量价信息刻画  个股分层LongShort 逐日将每个申万一级行业内的所有最新成分股的日收益率进行横截面升序排名, 然后逐日进行横截面Long-Short 测算,具体算法步骤如图1。Long-Short 算法刻画 图1 :个股分层LongShort 算法 计算步骤:  取最近500 个交易日的个股行情数据,设为:StkQdata 。  逐日、逐行业,计算最新成分股日收益率,设为:Dret。  逐日、逐行业个股Dret 按照升序分5 组,计算每组算术平均收益,设为: DretMean_N ,其中N 表示组别,取[1,5]的整数。  逐日、逐行业,令Dlongshort = DretMean_5 – DretMean_1。  逐行业,将每日Dlongshort 累加,得DLS_cum。  逐日,将DLS_cum 横截面降序排名,即排名值越小,分化度越大。  降频处理,日数据粒度,降频为月数据粒度。 资料来源:国联证券研究所 3 请 根据图 1 所述的分层Long-Short 算法得到的行业分化度刻画指标如图2 所示。 图2 截面的行业内个股Long-Short 分化度刻画的排序值,排序值小表示 分化度大。当前截面,分层LongShort 算法刻画行业分化度排序第1 的是电力设备行 业,但是从近 10 年平均来看,电力设备行业的分化度排序平均值为 8.6。这表示电 力设备随着近两年的行业发展,行业内部产生了比较大的分化。 图2 :分层LongShort 算法刻画行业分化度截面 LongShort 最新 近10年最大 近10年最小 近10年平均 电力设备 1 20 1 8.6  美容护理 2 25 1 6.3

文档评论(0)

1亿VIP精品文档

相关文档