- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘案例--库存预测
背景知识
向顾客提供大量产品的国内和国际零售商都面临着共同的挑战:确保其众多的商店具有适当的产品库存级别。确定适当的库存级别问题需要在以下两种竞争成本间进行权衡。
1. 高级别库存的存储成本。这些成本指零售商为安全的实际空间、额外的供应商购买以及在所有零售商店中与维持高级别产品库存相关的分配所支付的代价。 2. 丧失销售的成本。如果顾客进入商店,想要购买某种特定的产品,但由于该产品已脱销而无法供货,就形成了这些成本。 面对这种进退两难的情况,零售商通常有两种选择。零售商可以保持高库存,而承担高库存成本;或者保持低库存成本,而承担在顾客需要购买时由于没有产品而丧失销售机会的风险。权衡这些竞争成本的最佳方式是构建预测模型来确保每个连锁商店都具有适当的库存级别。
过去零售商依靠供应链软件、内部分析软件甚至直觉来预测库存需求。随着竞争压力的一天天增大,很多零售商(从主要财务主管到库存管理员)都开始致力于找到一些更准确的方法来预测其连锁商店应保有的库存。预测分析是一种解决方案。它能够准确预测哪些商店位置应该保持哪些产品。
本文介绍如何使用 Microsoft(R) SQL Server(TM) 2005 中的 Analysis Services 以及 SQL Server 数据仓库,采用数据挖掘技术为产品存储决策提供准确及时的信息。此处介绍的方法用于在商店/产品级别上提供脱销预测。对于某种特定产品,SQL Server 2005 Analysis Services 用于构建数据挖掘模型,该模型为每个连锁商店提供脱销预测。此方法使零售商能够有效地权衡与存储产品库存相关的竞争成本。
返回页首
关于 Project REAL
Project REAL 致力于找出创建基于 SQL Server 2005 的商业智能 (BI) 应用程序的最佳方法。在 Project REAL 中,我们通过创建基于真实客户方案的引用实现来进行。这意味着将客户数据引入内部,并使用这些数据来解决各个客户在部署过程中将会面临的相同问题。这些问题包括:
? 架构设计 - 关系架构和 Analysis Services 中使用的架构。 ? 数据提取、转换和加载 (ETL) 过程的实现。 ? 客户前端系统的设计与部署,以便进行报告和交互式分析。 ? 生产系统的规模大小调整。 ? 对运行中的系统的管理与维护,包括对数据的增量式更新。 通过分析真实的部署情况,我们可以全面了解如何使用 SQL Server BI 工具实现 BI 系统。我们的目标是致力于解决可能希望分析大型数据集的公司在其实际部署中遇到的所有问题。
本文概述了至今已为 Project REAL 执行的数据挖掘工作。很多其他文章介绍了已经完成的工作和在其他领域学过的课程。要查找最新的信息,请访问 Project REAL 网站 (/sql/bi/ProjectREAL/)。
返回页首
数据仓库说明
在 Project REAL 中,构建的数据仓库用于为在全国拥有数百家商店的零售商的数百万种产品汇总销售数据。用于构建脱销预测模型的相关数据集有:
? 以商店级别、产品(项)级别、天级别合计的销售量事实数据。具体地说,是为已经销售的每种产品、零售商的每个连锁商店存储每日销售量。 ? 以商店级别、产品(项)级别、天级别合计的库存事实数据。具体地说,这是每种产品、每天、零售商的每个连锁商店的产品在库存中的天数。 ? 由产品名、说明、零售价和产品类别层次结构组成的产品(项)信息。 ? 由商店说明、商店分类(例如,指定是大型商店还是小型商店的指标)、商店分区、商店区域、商店地区、城市、邮政编码、省/自治区、货架空间线性尺寸和其他商店信息组成的商店信息。 ? 日期信息(日期维度),它将事实数据级日期标识符映射到相应的财务周、财务月、财务季、财务年和其他日期信息。 具有一个清晰、最新的数据仓库可以为所有商业智能应用程序利用此有用的信息资产提供可靠的基础。在此特殊的构建脱销模型的任务中,数据仓库简化了构建数据集模型的过程。
返回页首
数据挖掘方法和构建数据集模型
根据在 Project REAL 中将数据挖掘技术应用于不同零售销售量预测和构建脱销模型问题所获得的经验,我们提出了通过两个阶段来构建模型,这一过程提高了准确预测的可能性。
构建模型过程的第 I 阶段是基于合计销售量模式对零售商的连锁商店进行分类。构建了质量商店分类模型后,在构造模型过程的第 II 阶段,这些分类用于使商店/产品级别上的脱销预测更加准确。通过使用 SQL Server 2005 Analysis Services 中的数据挖掘技术可以高效并有效解决这两个阶段。
本部分提供了整个脱销预测过程的详细信息,该过程从用于构建数据集模型的过程说
文档评论(0)