- 1
- 0
- 约7.14万字
- 约 46页
- 2025-10-21 发布于甘肃
- 举报
队伍编号MCB2302926
赛道B
基于ARIMA与LSTM时间序列的电商产品需求量预测
摘要
可靠的用户需求量预测,对电商平台各商家对仓库、商品的管理和决策非常重要。
本文对于商家、仓库、产品在时间序列上的需求量进行分析及预测,针对不同情况得
到不同情况下的需求量预测情况。
针对问题一,本文首先对于数据进行预处理,对于附件1中的商家、仓库、产品
的编号进行组合合并成1996种,如29-1-915为一个组合并在后文统称组合,通过可
视化图表发现“双12”购物节和春节时间段各商品的需求量出现明显与平时期间异常
的波动,因此对于这部分时间进行剔除,预测所采用的需求量数据从2023年2月1
日开始到2023年5月15日。针对预处理之后的数据,本文采用ARIMA时间序列和
LSTM两种方法对组合2023年5月16日到5月30日的需求量进行预测,其中ARIMA
时间序列本文通过python语言设置循环语句用AIC准则选取最小的AIC得到所需的
p、d、q值进行预测,LSTM采用MATLAB编程实现LSTM时间序列预测,两个方
法算出来的平均1-wmape分别为:0.7628、0.8344。通过1-wmape的值对两种方法进
行赋权相加得到最终结果。对于聚类本文使用K--means聚类按照不同的聚类标准,
将1996个组合分别聚成4类和5类,并运用主成分分析法(PCA)降维实现可视化
效果。
针对问题二,本文同样对于附件5中提供的新维度的数据进行组合,附件5中的
新组合共有210个,再将附件5中的新组合按照出现的时间分为5类,其中4月1日
到4月5日出现的组合为一类,以此类推,其中每组分别含有66、29、57、42、16
个组合,再分别对每组的组合与附件1中的组合计算Spearman相关系数,找到相关
性最高的组合且P值小于0.05,如附件5中的组合14-21-239对应附件1中的组合
35-53-1423,其Spearman相关系数为0.8685且P值为3.83E-13远小于0.05,每个附
件5中的组合都在附件1中找到与之对应的相关性最强的组合,再将附件5中每个组
合的数据带入问题一中已经训练完的LSTM和ARIMA时间序列方程中得到附件5中
新组合在2023年5月15日到2023年5月30的需求量预测值,预测结果详见附录。
针对问题三,本文对于附件6数据进行组合共有1957个组合,再通过对于数据
的可视化处理发现用户在11月1日到11月11日的需求量出现先上升后下降在上升
的整体趋势,结合各店商在“双11”的促销安排,可以大致将“双11”购物节分为三个
阶段:开门红、品类日主题日、高峰期狂欢日。本文对于“618”期间的个组合预测
分为两步,即正常预测与引入购物节因子(品类因子、地区因子),因此首先对于“618”
期间各组合的需求量通过ARIMA时间序列与LSTM赋权相加进行如平时期间相同的
预测,第二步再计算各一级分类商品在“双11”期间的品类因子,如宠物生活在“双11”
中每天的品类因子即为1.0482,1.4386,1.8240,1.4737等等,再计算各地区在“双11”
期间的地区因子,如东北地区在“双11”中每天的地区因子为2.3006,2.0367,1.6779,
1.6252等等,通过“双11”购物节的购物节因子按照分成的三个阶段进行线性插值得到
“618”期间的品类因子和地区因子。通过ARIMA时间序列和LSTM赋权相加的预测
结果结合两种因子的约束条件,得到“618”期间需求量预测值,预测结果详见附录。
关键词:ARIMA时间序列LSTM购物节因子Spearman相关系数K-means聚类
1
目录
基于ARIMA与LSTM时间序列的电商产品需求量预测1
摘要1
一、问题重述4
1.1问题背景4
1.2问题提出4
二、问题分析4
2
原创力文档

文档评论(0)