- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
队伍编号MCB2301622
赛道B
基于指数平滑与DBSCAN的多重特征电商需求时序预测模型
摘要
随着消费水平的提高,电商平台依托线上销售渠道的兴起,逐渐进入人们的视野,
并且凭借它的数字化管理系统仓库,得到众多商家的青睐。因此及时存储处于空档期间
的仓库、预知各地仓库的需求量对商家和客户来说,是双赢的局面。
针对问题一:解决各商家在各仓库的商品的需求量并根据商家-仓库-商品三个维度
进行时序分类。首先进行数据预处理,包括:剔除重复值、标签编码、异常值处理等,
利用小提琴图识别异常值确保数据的合理性,之后将数据转化为数值型方便后期处理。
接着观察附件2,发现部分商品销售量与时间有关,因此使用皮尔逊相关系数探索各类
商品与时间的相关程度。分析相关系数分布图发现可以将商品划分为与时间有关和与时
间无关的两类,从而采用季节性和非季节性模型预测。对于季节性商品,使用Holt-
Winters、ARIMA、MA等模型预测,最终调整参数选取使MSE最小的指数平滑模型进
行时序预测;对于非季节性商品,使用KNN、SVM、随机森林预测,最终选取准确率
最高为91%的KNN预测结果。对于分类问题,先采用主成分分析降维处理,通过累计
方差解释图发现降成5维可保留90%的原始信息,分别使用Kmeans与DBSCAN模型
对商品进行加权分类,通过可视化对比发现DBSCAN的结果更加准确:17类,结果见
表6。此外,本文还寻找最佳轮廓系数对聚类模型进行了评估,发现准确度高达93%。
针对问题二:面对商家-仓库-商品维度中新增的信息,结合问题一历史数据进行预
测。将问题可划分为:预测新增商品、预测更换仓库的商品两方面求解。问题一得出:
同类型商品分布特征一致,因此对于新增商品,只需判断它的类别,使用问题一中同类
别的预测方法预测即可。对于更换了仓库的1683号商品,计算该商品与其他商品的余
弦相似度,通过数据对比发现最相似的同类商品为877号,而它在问题一中被判定与时
间无关,因此继续使用KNN算法进行预测。
针对问题三:参考题目给的去年双十一数据对六月份需求量进行预测,但由于11月
促销期数据量较少,本文将12月份作为10月份数据,并与11月份的数据一同构成趋
势增长的数据;并将该递增数据与5月份数据一同作为训练集,预测6月份的销售数据。
本文基于SVM、RDF、ARIMA、指数平滑四种基础模型和GBR模型的Stacking集成
学习模型进行预测。对比各模型发现Stacking集成学习比单一模型预测结果准确度高。
关键词:皮尔逊相关系数指数平滑DBSCAN余弦相似度Stacking集成学习
目录
一、问题的提出1
1.1问题背景1
1.2问题重述1
二、问题的分析2
2.1问题一的分析2
2.2问题二的分析2
2.3问题三的分析2
三、符号说明3
四、模型的假设4
五、数据预处理4
5.2数据清洗5
5.2数据特征的初步探索6
5.2.1皮尔逊相关分析6
5.2.2商品信息中类别属性分析7
六、模型的建立与求解8
6.1问题一模型的建立与求解8
6.1.1季节性时间序列模型的建立8
6.1.2随机森林模型的建立9
6.1.3KNN模型的建立10
6.1.4多分类SVM模型的建立10
6.1.5非季节性预测模型的选择11
6.1.6需求量预测结果12
6.1.7预测结果合理性分析13
6.1.8主成分分析14
6.1.9多种分类模型的建立16
6.1.10分类结果16
6.1.11分类结果合理性分析16
6.2问题二的建立与求解17
6.2.1
您可能关注的文档
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-经度-气压-风速-移动速度-纬度)_(降水量).docx
- gbdt回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- xgboost回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- 决策树回归_(台风起始时间-台风结束时间-当前台风时间-经度-风速-气压-纬度-移动速度-台风等级)_(降水量).docx
- 决策树回归(经度).docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-风速-经度-气压-移动速度-降水量)_(纬度).docx
- gbdt回归_(台风起始时间-台风结束时间-经度-当前台风时间-台风等级-风速-气压-移动速度-降水量)_(纬度).docx
- xgboost回归_(台风起始时间-台风结束时间-当前台风时间-台风强度-风速-经度-气压-降水量-移动速度)_(纬度).docx
- 决策树回归_(经度-台风起始时间-台风结束时间-当前台风时间-风速-气压-移动速度-降水量-台风强度)_(纬度).docx
- 350 个品类的库存量 - 副本.xlsx
- DB44_T+2767-2025河口海湾总氮、总磷水质评价指南.docx
- 中医药科技成果转化评价技术规范.docx
- DB44_T+2750-2025农村供水工程数字化建设技术导则.docx
- DB44_T+2769-2025金属矿山生态修复技术规范.docx
- 镁合金航天航空零部件长效防护微弧氧化膜层工艺规范.docx
- 《甘青青兰中绿原酸和胡麻苷含量的测定 高效液相色谱法》发布稿.pdf
- DB44_T+753-2025声环境质量自动监测技术规范.docx
- 信息技术 智算服务 异构算力虚拟化及池化系统要求.docx
- DB44_T+2759-2025黄荆栽培技术规程.docx
- 废生物制药溶媒再生乙腈.docx
最近下载
- 全景图像拼接技术研究与实现.docx VIP
- 全国统一安装工程预算定额.pdf VIP
- 明伟NES系列改可调方案(参考).pdf VIP
- 呼出气一氧化氮(FeNO)测定临床应用规范.docx
- 亚低温冬眠治疗PPT参考幻灯片.ppt VIP
- 仁爱科普版(2024)七年级英语上册课件 Unit 6 第7课时 Reading for Writing.pptx VIP
- 安徽医学高等专科学校《人体解剖学》2025 学年第一学期期末试卷(B).pdf VIP
- 现代机器人培训资料.pptx VIP
- YD5003-2023通信建筑工程设计规范.docx VIP
- 上交所发行上市审核动态(2024年第5期).pdf VIP
原创力文档


文档评论(0)