- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库技术在服装销售领域应用探究
摘要:数据仓库作为信息处理领域的一种新技术,有着广 阔的应用前景。本文以服装销售领域为例,研究数据仓库建 模方法和实现过程。主要研究了销售主题下的产品类别、时 间和地区维度,结合OLAP技术,展示了数据仓库系统的实 用价值。
关键词:数据仓库OLAP服装销售
中图分类号:TP311文献标识码:A文章编号:
1007-9416 (2012) 11-0064-02
1、引言
数据仓库是一个面向主题的、集成的、时变的、非易失
数据仓库是一个面向主题的、集成的、
时变的、非易失
性的数据集合,支持管理部门的决策过程。数据仓库系统通 常需要涉及数据源、数据仓库、OLAP服务器和前端应用几个 部分。其中数据源是整个系统的数据来源,包括各种原始的 业务数据。数据仓库是整个系统的核心,负责集成经过抽取 和转换的源数据,并向OLAP服务器提供数据。OLAP服务器 负责向用户提供分析结果,而前端应用主要包括各种报表工 具或查询工具等。本文研究在服装销售领域内数据仓库的建 立过程和方法,以服装销售信息系统中关系数据库为数据 源,实现了一个实用的数据仓库系统,为管理人员分析销售 形势提供了有力的帮助。
2、数据仓库建模
2. 1事实表与维度选择
对于面向全国进行服装销售的公司而言,主要的业务元 素有客户、产品、销售时间、销售数量和价格等。本数据仓 库的逻辑模型采用了雪花模型,主要关注产品销售主题,如 下图所示。该模型的结构特点是:以产品销售这个事实表为 中心,从时间、地域和产品三个维度向外进行了扩展,并且 销售产品属于不同的产品类别,如男装、上衣、衬衣等。产 品销售事实表中的信息来自于服装销售业务管理系统的订 单表,其中数据仓库主要利用的字段有产品编号、地区编号、 销售数量、销售单价和销售日期。
2.2服装销售的维度分析
服装销售时,管理人员需要对销售情况进行分析,了解 分产品类别、分时期、分地域的销售效果,然后制定新的销 售计划。在产品类别、时间和地区这三个维度上,级别表达 了数据的层级结构,从数据的最大(汇总程度最大)级别直 到最小(最详细)级别。如年、月、日代表了三个不同的时 间层级。
2. 2. 1产品类别维度
在实际的业务管理系统中,服装产品可能有数千种。在 我们所选企业的数据库中,产品类别分为大类、中类和小类 三个级别。例如女装是一个大类,上装又是其下属的一个中 类,T恤则是上装下属的一个小类。产品类别的层级结构如 下图所示。
从数据仓库的模型(图1)可以看出,事实表中每个产 品编号代表一种特定的商品,而通过产品表将其归属于某一 个特定产品小类;获得产品小类编号后,可以在产品类型编 号表中查找它所对应的产品中类和大类。通过对销售事实信 息在不同粒度上的汇总,我们可以获得各个类别产品的销售 情况(如图2)。
2.2.2 时间维度
在各种管理信息系统中,时间都是常见的信息。在激烈 的竞争中,时间也是服装销售决策者需要重点关注的因素之 一。他们需要了解什么时间产品的销售形势较好,什么时间 不好,以及各个时间段本企业的销售业绩如何。
为了适应业务需求,我们将时间维度分为年、月和日三 个层次。系统首先按照不同年份进行销售数量和金额的统 计,然后又细分为按月统计和按日统计。如见维度各层次的 关系如图3所示。
2. 2.3地区维度
我国幅员辽阔,人口众多,但各地区经济发展水平不同, 并且气候变化、文化习俗也有不同。因此,地域因素对服装 销售也存在较大程度的影响。例如,羽绒服在南方省份的销 量可能就不太好。将产品销量和金额分地区进行统计和分析 后,决策者可以有针对性地拓展市场,投放广告。在销售事 实表中,地区编号实为邮政编码。根据我国的行政区划,自 然可以得出如图4所示的地区层次结构,分为省(直辖市、 自治区)、市(区)两级。
3、数据仓库实现
我们以一家知名服装企业为例,设计并实现了一个数据 仓库系统。源数据来自于该企业的业务管理系统,主要是销 售订单、产品信息、产品类别信息等。经过较为简单的数据 抽取和转换过程,统计出不同维度下、不同粒度的组合信息。 每个订单记录了最详细的销售信息:销售的日期、产品的编 号和邮政编码,根据维表中的信息,可以将此订单的销售数 量和金额归总于相应的数据立方体。为了获得任意组合条件 下的销售数量和金额,我们进行了大量的统计求和处理,并 将统计结果保存于不同的数据库表中。为了实现多维分析功 能,我们采用了开源的OLAP服务器Mondrian,并通过适当 的配置,使其可以方便的显示我们加载的数据仓库数据。
下面四幅图即为在不同维度、不同粒度下的Mondrian 查询结果界面。其中图5、图6和图7分别显示了按照产品 类别、时间和地区维度展开的销售情况统计结果。实际上 Mondrian可以继续
文档评论(0)