数据仓库的概念模型设计模型定义.docVIP

 数据仓库的概念模型设计模型定义.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
 数据仓库的概念模型设计模型定义

完成概念模型的需求调查后,可以开始进行概念模型的定义。在概念模型的定义过程中需要确定系统的范围以及所涉及的对象。模型的设计先要明确所要构建的内容,设计模型的起点是所选择的主题域。数据仓库是面向决策进行分析的数据库,无法在数据仓库设计时就确定用户明确而详细的需求,只有一些基本的需求方向、基本的数据需求摆在设计着面前:要做的决策有哪些?决策者感兴趣的是什么问题?解决这些问题需要什么样的信息?   作为传统的业务处理系统的开发,在其开发分析中需要明确业务处理的具体功能,即系统的开发是基于功能驱动的,数据仓库开发人员在数据仓库形成与应用之前是不可能了解数据仓库的功能的。因此,无法采用功能驱动开发方法进行数据仓库的开发,但是,数据仓库的开发人员可以在数据仓库开发之前通过数据仓库的需求分析,了解数据仓库用户的大致需求,即在决策过程中需要什么信息。这样,就可以界定一个数据仓库的大致系统边界,集中精力进行主要部分的开发。因而,界定边界的工作也可看作是数据仓库系统设计的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出来。   例如,以某个超市的数据仓库设计为例。由于超市的业务需求,已经建立了一些分散的数据库,分别处理各自的业务,各个数据库是按照各个部门的具体需求建立起来的,这样的组织是的数据各自为政、缺乏全局性,管理层想要在这些数据库的基础上得到一些全局报表,进行一些分析工作是比较困难的。因此,超市的管理层决定要在原有的数据库系统基础上建立一个数据仓库。为实现该数据仓库的概念模型的定义,首先需要分析用户的决策需求,其次,分析为实现这些决策分析,数据仓库应该提供哪些信息。   1、数据仓库用户的决策分析   从决定数据仓库的开发初衷来说,超市管理者最迫切的需求是能更准确地把握超市商品的销售情况和库存情况。   为制定一个较长期的营销策略,超市经营者目前所要进行的分析有:客户的购买趋势、商品供应市场的变化趋势,供应商和客户的信息用等级等情况。   2、支持决策的数据需求分析   管理决策者完成以上的决策分析,需要商品销售量、商品采购量、客户情况和供应商情况这样一些数据。   3、数据需求分析工具   为了对数据进行完整的、规范的分析,可以采用用户信息需求表来描述用户的信息需求状况。在用户信息需求表中列出概念模型定义中所确定的数据仓库用户决策分析问题以及所要的信息。在列出所有需要信息的同时,还要明确这些信息的详略程度。例如,对客户购买商品趋势分析时,可能根据客户购买商品时所在的国家、省、市、街道、商店进行分析。此时,应将这些不同层次的信息按照层次的高低一次填写在用户信息需求表中,并且在所需要的信息名称后面表明这些信息可能分成多少个组别,才能满足决策分析的需要。利用这张表可以为客户购买商品趋势分析的主题确定不同的维:时间、地点和商品等,并且可以进一步确定维的层次。   表1 用户信息需求表   决策分析问题 客户购买商品趋势分析 需求信息类 日期 地点 商品 年龄组 经济状况 信用 需求信息1层 需求信息2层 需求信息3层 需求信息4层 需求信息5层 …… 年(4) 季度(16) 月(48) …… 国家(15) 省(60) 城市(200) 街道(4800) 商店(20000) …… 商品种类(15) 商品小类(78) 商品(4500) …… 年龄组(8) …… 经济类(12) 信用(10)   信息需求单位:????????? 信息需求采集人:???????? 信息需求表填写时间:     4、CRUD矩阵   CRUD矩阵是指利用矩阵的形式来表示各个不同用户对不同操作的动作行为。其中,C是Creat——产生,R是Read——引用,U是Update——更新,D是Delete——删除。   概念模型的定义,不仅需要构建一个ERD模型,还要了解ERD模型中每一个实体的诞生与消亡事件。因为只有在实体诞生以后,数据仓库才能从数据源中获取关于这一实体的数据。当这个实体消亡后,还需要将该实体的消亡状况在数据仓库的元数据中记录下来。为了提高系统的处理效率,在业务处理系统中常将一些历史数据删除,但是在数据仓库中这些历史数据却要保留下来。   例如,在销售业务处理系统中,某个客户第一次购买商品,系统会将一些相关信息记录在案,但是,某个已经记录在案的客户,如果在两年中没有订购商品,就要在业务系统中将其置于停顿状态,如果在三年内没有购买商品,系统将会删除该客户的记录。而在数据仓库中,该客户的信息将长期存在,因为管理人员可能需要了解五年中的客户信息,数据仓库就需要提供销售情况的五年快照。这些快照的信息包含客户的第一次订购时间、最后一次订购时间、目前的状况等信息。为了获取这些信息,在数据仓库的高层模型中就需要使用CRUD矩阵反映实体的生成、引用、更新和

文档评论(0)

dao1314520 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档