企业数据仓库设计与实现.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
企业数据仓库设计与实现

企业数据仓库的设计与实现   [摘要]介绍了数据仓库在企业实现的设计和实施过程。   [关键词]数据库 数据仓库 数据挖掘   中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2008)0720039-02      数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、随时间不断变化的数据集合。数据仓库是决策支持系统的基础。它被设计用于克服企业使用OLTP(Online Transaction Processing)数据库系统进行决策分析时遇到的不可逾越的困难。数据仓库就是一个数据存储中心,这些数据是从OLTP数据库的操作数据中提取出来的。与数据仓库不同,OLTP系统是设计用来存储高速处理事务的操作数据的。因为在这些数据库中数据存放的结构对于客户端来说难以理解,所以从中获取信息也比较困难。把这些难以理解的数据转换到一个数据仓库就可以使信息放在一个更容易获取的框架结构中。与OLTP系统比较,数据仓库无须改变已存在的数据就可以接收新数据。因此,该存储结构为容纳海量信息而设计,它们以支持快速检索高效事务处理的结构化方式存储信息。      一、建设数据仓库的目的      公司管理信息系统应用多年,已积累了大量的原始数据。如客户资料及销售数据等。随着公司的业务发展,如何通过这些数据提取有效的信息,为决策支持提供服务,显得日益迫切。   客户关系管理是电子商务活动的核心部分。对客户关系管理的重视是今日商业运作方式转变的结果。客户忠诚度和品牌忠诚度的易变性、加入WTO之后市场的开放承诺及市场准入门槛的降低,要求电子商务必须比以往任何时候都更需详细地了解客户。谁赢得了与客户持久的合作关系,谁就赢得了竞争。   随着公司电子商务的发展,CALL CENTER的建设,如何给客户提供全新的个性化、自定义的服务,也成为公司提高整体服务水平的重要内容之一。目前尚无一种系统能够通过对以往客户销售数据的分析来为客户提供有针对性的服务,而数据仓库和数据挖掘技术是收集、集成和分析所有客户数据的基础,在此基础上分析客户销售数据,总结客户的购买规律,作为客户个性化服务的数据来源。      二、建设数据仓库的步骤      开发数据仓库的流程包括以下几个步骤:   (一)启动工程   建立开发数据仓库工程的目标及制定工程计划。计划包括数据范围、提供者、技术设备、资源、技能、组员培训、责任、方式方法、工程跟踪及详细工程调度等。   (二)建立技术环境   选择实现数据仓库的软硬件资源,包括开发平台、DBMS、网络通信、开发工具、终端访问工具及建立服务水平目标(可用性、装载、维护及查询性能)等。   (三)确定主题,进行数据建模   根据决策需求确定主题,选择数据源,对数据仓库的数据组织进行逻辑结构设计。   (四)设计数据仓库中的数据库   基于用户的需求,着重于某个主题,开发数据仓库中数据的物理存储结构,即设计多维数据结构的事实表和维表。   (五)数据转换程序   实现从数据源中抽取数据、清理数据、一致性格式化数据、综合数据及装载数据等过程的设计和编码。   (六)管理元数据定义   元数据,即表示、定义数据的意义及系统各组成部件之间的关系。元数据包括关键字、属性、数据描述、物理数据结构、源数据结构、映射及转换规则、综合算法、代码、缺省值、安全要求、变化及数据时限等。   (七)开发用户决策的数据分析工具   建立结构化的决策支持查询,实现和使用数据仓库的数据分析工具,包括优化查询工具、统计分析工具、C/S工具、OLAP工具及数据开采工具等,通过分析工具实现决策支持需求。   (八)管理数据仓库环境   数据仓库必须像其他系统一样进行管理,包括质量检测、管理决策支持工具及应用程序,并定期进行数据更新,使数据仓库正常运行。      三、数据仓库模型的规划及设计      这一步是成功建立数据仓库的关键一步,包括定义需求和数据仓库的逻辑设计。在这一步里,需要完成整个数据仓库的规划,需要知道这个数据仓库建成后可以进行哪些查询,而这些查询的原始数据从哪里来,这些包括:   (一)根据决策需求确定主题,也就是说要明确目前的需求,提出很好的应用。   (二)选择数据源。这些原始数据,可能来源于异种数据库,可能来源多种的业务系统,这些数据将要满足数据仓库的应用需求。   (三)对数据仓库的数据组织进行逻辑结构设计。按照数据仓库概念和数据仓库技术进行设计,这些设计是基于第一点的明确应用需求的。要确定选择哪些事实表,哪些Measures,哪些维,它们的存储模式,聚合数据生成程度,建立哪些Cubes和Virtual Cubes,哪些计算成员等等。   这一步工作直接影响到下

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档