连锁超市数据集市数据模型设计研究.docVIP

连锁超市数据集市数据模型设计研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
连锁超市数据集市数据模型设计研究

连锁超市数据集市数据模型设计研究   [摘 要] 在研究数据仓库技术的基础上,将“数据仓库”理论运用于我国发展中的连锁超市的决策管理,提出了连锁超市数据集市的数据模型――雪花模型。并对数据模型中的事实表、维度表、大维度、粒度、聚集事实表等相关的技术问题,进行了细致的探讨。对研究并建立连锁超市数据仓库具有参考价值和实际意义。   [关键词] 连锁超市 数据仓库 数据集市 雪花模型 基础事实表 维表 聚集事实表      随着市场经济的发展和人民生活水平的提高,购物环境舒适的超级市场正在得到越来越多消费者的青睐,连锁超市已经成为我国商业零售业的发展主流。加入WTO后,我国商业零售业在应对国内竞争的同时,将面临来自沃尔玛、家乐福、麦德龙等国际零售巨头激烈的国际竞争。因而我们不仅要密切跟踪行业发展趋势,同时要借鉴吸收国内外先进的管理模式,坚持本土化和国际化相结合,在营销和管理工作上走出自己的经营特色之路,最终在竞争中求得生存与发展。   在信息时代,谁能在信息的海洋中获取更多的知识,谁就能取得成功的主动权。信息技术在企业的决策和商业活动中起着重要的支持作用。   信息技术的迅速发展和企业管理决策的迫切需要,使数据仓库理论应运而生,并成为决策支持领域中实用性极强的技术。   一、数据仓库和数据集市   数据仓库技术是当前用于企业决策支持的、先进的有效方法。   1993年,W.H.lnmon在其所著《Building the Data Warehouse》中对数据仓库进行了完整的界定。他将数据仓库定义为:“一个面向主题的、集成的、随时间变化的、非易失性的数据集合,用以支持管理层的决策”。这一界定被学术界广泛认同。W.H.lnmon关于数据仓库的定义,可以从几方面来理解:   1.数据仓库是一种数据资源集成与整合的具体方法。数据仓库不同于一般的数据库。它是按照一定的要求、围绕明确的主题,对原有分散的、相互独立,异构的操作型数据进行有效集成。   2.数据仓库存储的数据具有相对的稳定性。   3.数据仓库的数据主要用于对管理决策过程的支持。   数据仓库的鲜明特点,使数据仓库技术具有广泛的应用前景。目前,已有不少行业把数据仓库技术用于数据管理和决策支持,取得了经验,产生了效益。   数据集市是数据仓库的一个子集,它面向部门级业务,面向某个特定的主题。是一种简化的小型数据仓库。实际上,多个相互联系的、围绕一个宏观大主题的多个数据集市的集成,就构成了数据仓库。数据集市和数据仓库在其实现过程和数据模式方面,没有根本的差异。而数据集市比数据仓库更为简洁、方便,易于快速实施并应用。因此,在建立企业级的数据仓库前,可规划建立多个部门级的数据集市,在此基础上,集成实现企业级的数据仓库。   二、数据仓库的“星型模型”   “星型模型”是数据仓库广泛采用的数据模型。它能准确、简洁地描述出实体之间的逻辑关系。数据仓库的其他数据模型,一般是在“星型模型”的基础上的变形与扩充。一个典型的星型模式包括一个大型的事实表和一组逻辑上围绕这个事实表的维度表。如图1所示:   事实表是星型模型的核心。用于存放大量的具有业务性质的事实数据。事实表由主键和事实的度量数据两部分组成。事实表通过主键,把各维度表链接在一起,形成一个相互关联的整体,共同描述主题。事实表中存放的大量数据,是同主题密切相关的、用户最关心的、对象的度量数据。   维度是观察事实、分析主题的角度。维度表的集合是数据仓库数据模式的关键。维度表通过主关键字与事实表相连。用户依赖于维度表中的维度属性,对事实表中的事实数据进行查询、分析,从而得到支持决策的数据。   因此,对事实表和维表的分析设计,是数据仓库数据模型设计的关键。   三、连锁超市数据集市的数据模型   数据模型是建立数据仓库的基础。业务需求是进行数据仓库数据模型设计的驱动力。连锁超市商品销售情况可以看作超市管理数据仓库的一个子集,即数据集市。适宜选用以“星型模型”为基础,建立能满足需求的连锁超市数据集市的数据模型。   1.事实表的设计   如前所述,事实表由主键和度量数据两部分组成。星型模型中各维度表主键的组合构成事实表的主键。针对本文的研究主题,最需要关注的是连锁超市商品销售情况。因此,在事实表中,要准确记载各连锁超市所畅销的商品、销售数量、营业额、利润等度量数据。   事实表中数据的细节程度或综合程度的级别称为数据“粒度”。粒度是数据仓库事实表的重要的特征。粒度的级别依赖于维表的属性。不同的需求,对数据仓库的粒度要求不同。   连锁超市数据集市需要保留最低层次的细节数据,以满足数据集市的信息查询要求。很多数据挖掘的应用程序也需要最低层次的数据颗粒。再者,低粒度的事实表便于从操作型系统中抽取源

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档