- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习实战案例
机器学习实战案例
——零售企业商品销售预测
——零售企业商品销售预测
业务背景分析
Ø 在电子商务业务蓬勃发展地同时,零售业遭遇了寒潮。2018年以来零售行业更是饱受电子商务地冲 ,进入数字时代后,数
据地有效使用成为零售企业颠覆传统地动力,也势必将改变零售业地格局。
Ø 零售业有非常多地场景需求广泛地使用机器学习来进行数据分析,例如通过对供应链数据地分析,发现库存地规律性变化,
合理优化物流环节达到减少库存,提高流通率地目地。对顾客购买数据地分析可以得到顾客地画像,从而为其个性化推荐
产品。也可以发现商品地销售模式,从而灵活地调整定价或销售方式。
Ø 借助数据分析技术,零售企业会做出更合适地决策,从而在激烈地市场竞争中获胜。
问题分析
Ø 零售商Big Mart地数据科学家收集了不同城市10家商店地1559种产品在2013年地销售数据,还定义了每个产品与商店地属性。
Ø 本案例地目地是建立一个Big Mart销售预测模型,使得公司可以预测每个产品在特定商店地销售情况,从而可以提前调整物流,
完善备货渠道, 以较高地效率完成销售流程。
Ø 在此模型地基本上,Big Mart也将尝试在增加销售额中起到关键作用地商品与商店地属 ,从而对商店与所售商品进行优化, 以
期增加公司整体销售额。本案例地步骤说明如表。
步骤 内容
数据探索,包含数据质量评估与合并数据集
数据探索
填补数据中地缺失值
填补缺失值
修正数据中地异常值
修正异常值
衍生了4个字段
新建字段
对于数据中地类型变量,将其数字化与独热编码化
数值化与独热编码
完成预处理工作,重新切分训练集与检验集
完成数据预处理
构造商品销售额预测模型,使用线性回归,Ridge回归,Lasso回归,Elastic Net回归,决策树回归,梯度提升树回归与随机森林回归多种算法
构建模型
构建预测模型
生成模型评估结果
模型评估
流程步骤说明
数据探索
Ø 对数据进行探索是数据分析过程中非常重要地一步,通过对数据地审阅可以发现一些明显地数据质量问题,例如数据缺失,分
布不均匀,数据错误质量问题。同时可以加深对数据结构与变量间关系地理解,为后续数据预处理与模型地选择提供有用地
信息。
Ø 本案例地数据包含不同城市10家商店地1559种产品在2013年地销售数据,共有12个字段,其中“Item_Outlet_Sales”字段为
目标预测值,下表是各个字段地描述。
变量名 描述
Item_Identifier 商品标识
Item_Weight 商品重量
Item_Fat_Content 商品是否是低脂地
Item_Visibility 该商品在某商店中曝光度地百分比
文档评论(0)