量化知宏观系列之一:基于机器学习的PPI预测模型.docxVIP

量化知宏观系列之一:基于机器学习的PPI预测模型.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
敬请参阅末页重要声明及评级说明证券研究报告 敬请参阅末页重要声明及评级说明 证券研究报告 宏观研究 宏观专题 基于机器学习的 PPI 预测模型——量化知宏观系列之一 报告日期: 2022-03-08 报告日期: 2022-03-08 主要观点: 价格和通胀是宏观分析研究的重要组成部分,本文通过梳理常见的 PPI 预测方 分析师:何宁执业证书号:S0010521100001 电话箱: hening@ 分析师:何宁 执业证书号:S0010521100001 电话邮箱: hening@ 一、传统 PPI 预测有哪些方法,哪些痛点? PPI 预测主要有三类:领先指标预测法、高频指标降频法和工业品价格合成法。1)领先指标预测法,通过挖掘符合经济运行规律的具有领先性的指标,确定最优领先期后进行回归预测,例如 CRB 工业原料指数领先 PPI 2-3 个月,由于相关性 和领先期不稳定,往往精度较低。 对高频指标做降频处理,简洁有效,生产资料价格指数与即期 PPI 相关性高达 0.98。由于自变量和因变量的具体构成关系不明确,导致无法调参和优化模型。 利用工业品价格合成 PPI,逻辑关系明晰,可信度和可调试性较强,理论上拟合效果在三种预测类型中最优。此前的相应研究存在两大难点:1)生产资料价格间种类繁多,传统线性 OLS 模型共线性问题严重,模型方差较大、容易过拟合,需要合适的变量筛选以确定 PPI 核心驱动因素;2)统计局对 PPI 分项权重披露 信息较少,如何理解统计过程中的权重以及调权方式尤为重要。 二、如何理解 PPI 权重和权重调整? 相关报告 《华安证券_ 宏观研究_ 相关报告 《华安证券_ 宏观研究_ 宏观点评 _CPI-PPI 触底了吗?价格传导如何》 2021-11-10 《华安证券_ 宏观研究_ 宏观专题 _CPI-PPI 见底回升,如何配置资产? ——通胀系列之一》2021-12-09 《华安证券_宏观研究_宏观点评_ 五大主线打开 2022 经济密码——中央经济工作会议点评》2021-12-12 《华安证券_宏观研究_宏观点评_ 是终点也是起点——12 月 PMI 点评》 2021-12-31 《华安证券_宏观研究_宏观点评_ 数说价格传导之谜——通胀系列之二》 2021-01-06 《华安证券_宏观研究_宏观点评_ 平稳收官——2021 年通胀点评》2022- 01-12 《华安证券_宏观研究_宏观点评_ 价格传导加强,困境反转来了?》2022- 02-16 根据统计局解释,“CPI 中每一种商品和服务的权重是根据这一类商品和服务的消费支出占整个篮子里的总支出比重作为权重的”。2019 年非洲猪瘟快速扩散, 全国能繁母猪与生猪存栏双降,猪肉价格于 19 年 11 月和 20 年 2 月达到两个高 位,而猪肉同比权重在 20 年 11 月攀至顶点的 4.6%,从历史曲线来看恰好滞后猪肉价格约 12 个月。PPI 和 CPI 指数的编制与统计保持一致,均采用链式拉式公式,合理推断统计局在计算 PPI 同比时采用去年同期(T-12 期)分行业工业销售产值的比重,在计算 PPI 环比时采用上期(T-1 期)权重。 根据 T-12 期行业营收占比加权计算的 PPI 最接近实际值。我们将 39 个行业 分项 PPI 同比按各期营收占比进行加权,其中 T-12、T-11 和 T-10 期与实际 PPI 同比的相关性均高于 99.85%,但 T-12 期平均偏差最小、效果最好。 三、基于机器学习的 PPI 预测模型 数据预处理:2016 月 1 月至 2021 年 12 月为数据始末时间,删除时间序列过 短的普通硅酸盐水泥、天然橡胶。取生产资料价格月均值、计算同比得到 48 个特 征变量。 基于 LASSO 筛选变量解决共线性问题。LASSO 在 OLS 回归的系数上增加一个惩罚项,求得模型的稀疏化解(部分系数为零)。分割数据集后,LASSO 回归从 48 个自变量中提取出 9 个关键变量,剔除不显著的因子,保留了无缝钢管、柴油、汽油、石蜡、无烟煤 5 个变量,模型解释力度 R^2 为 97.1%。 针对权重调整问题,我们将变量滞后 12 期以拟合当期生产资料销售产值波动对下年同比权重的影响。优化后,模型解释力度上升至 99.0%。这种替代方法的潜在假设是工业品价格的波动能代表工业品销售产值的变动,但供给侧改革期间, 上游原材料价升量跌,因而 2017 年初 PPI 预测和 PPI 实际值存在一定偏离。 四、模型预测 2 月 PPI 同比为 9.1% 1)3 月 4 日统计局发布了 2 月下旬的流通领域生产资料价格,2 月煤炭、石油、 化肥涨幅居前,系俄乌危机下大

您可能关注的文档

文档评论(0)

医疗行业资料分享 + 关注
实名认证
文档贡献者

医疗行业资料分享

1亿VIP精品文档

相关文档