第4章数据仓库的规划与开发.pptVIP

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章数据仓库的规划与开发

第4章 数据仓库的规划与开发 4.1数据仓库的投资分析 4.1.1建设数据仓库的必要性 1.企业应用数据仓库的目标 大致可以划分为三类: (1)将数据仓库作为企业的核心业务进行发展。(2)利用数据仓库来优化企业内部管理控制,如人力资源的管理、成本的管理、产品质量和服务质量的管理等等。 (3)利用数据仓库为企业增加商业机会,这主要包括帮助市场、销售部门对客户情况和市场情况进行分析,帮助企业决策者提供辅助决策信息。 2.企业建设数据仓库的必要性分析 4.1.2数据仓库的投资回报及风险分析 1.定量分析 定量分析通常使用的是ROI(Return of Investment,投资回报率)和投资回报周期来衡量。投资回报率是投资获得的收益部分除以投资所耗的部分,即: ROI=收益成本/成本现值 2.定性分析 (1)能否提高产品质量和服务质量? (2)能否优化内部资源配置,提高效率,降低成本? (3)能否改善企业与客户之间的关系,为客户提供更多、更好的服务? (4)能否改善管理层的管理能力、管理水平和管理效果? (5)能否为企业决策层的决策提供有效的支持? (6)能否提高企业的市场反应能力、反应速度? (7)能否为企业的技术创新和产品创新提供有效支持? 3.风险分析 建立数据仓库系统的过程中会面临以下几方面的风险: (1)企业将建立数据仓库系统的目标定得过于远大,不切合实际,最终难以实现。 (2)系统的实现周期过长在一定程度上将导致项目风险的加大。 (3)由于项目控制不当而产生的风险。 (4)由于忽视了数据仓库系统的后期维护而产生的风险。 4.2数据仓库的开发方法 4.2.l瀑布式开发方法 4.2.2螺旋式开发 4.3数据仓库的建立过程 4.3.1数据进入数据仓库的过程与建立数据仓库的步骤 1.数据进入数据仓库的基本过程 操作数据向数据仓库的移动包括以下五个过程:提取、变换、净化、加载和汇总。 2.建立数据仓库的步骤 (1)收集和分析业务需求。 (2)建立数据模型和数据仓库的物理设计。 (3)定义数据源。 (4)选择数据仓库技术和平台 (5)从操作型数据库中提取、转换和净化数据并加载到数据仓库。 (6)选择访问和报表工具。 (7)选择数据库连接软件。 (8)选择数据分析和数据展示软件。 (9)更新数据仓库。 4.3.2需求分析 数据仓库开发过程中每一个阶段的每一项任务都是由需求决定的。 (1)数据仓库的需求 。用户必须能够从数据仓库中找到他们所需要的所有战略信息,必须能够方便地访问数据仓库,运行查询,得到结果,并且毫无阻碍地进行结果分析。 (2)综合分析之后形成一份需求定义文档。 4.3.3数据路线 1.概念模型设计 概念模型设计的操作主要是对原有数据库系统中的数据进行集成和重组而形成的数据集合。 2.逻辑模型设计 通过逻辑模型设计,可以对每个当前要装载的主题的逻辑实现进行定义,并将相关的内容(如适当的粒度划分,合理的数据分割策略,合适的数据来源等)记录在数据仓库的元数据中。 3 .物理模型设计 通过物理模型设计,可以确定数据的存储结构,存放位置,索引策略及存储分配。 4 .数据装载接口设计 编制数据装载程序,该程序包括了数据装载功能和数据综合功能。数据装载功能负责数据抽取、转换、清洗、集成,数据综合功能负责将集成的细节数据转化为不同综合层次的数据。 4.3.4技术路线 技术路线将会确定数据仓库的基础构造。并且这种基础构造包括两类:操作型基础构造和物理基础构造。 1、操作型基础构造 操作型基础构造包括人员、流程、培训和管理软件。 2.物理基础构造 物理基础构造主要包括计算机平台和一系列的工具。 4.3.5应用路线 数据仓库的应用设计主要包括OLAP模型设计、数据挖掘模型设计和信息传递设计等。 1.OLAP模型设计 2.数据挖掘模型设计 3.信息传递 。 通常用户和数据仓库包括六个阶段的交互过程: (1)依据数据仓库中的数据来定义需求;(2)从数据仓库中来选择合适的数据子集; (3)用计算机来操作丰富的子集; (4)将行业含义和选择的数据结合起来;(5)将结果构建成适合用户的格式;(6)用各种方式来表示结构化的结果。 4.3.6数据仓库部署 数据部署的工作主要包括用户认可、初始装载、桌面准备和初始培训等内容。 1.用户认可。主要工作是测试所有用户的界面和系统的性能。 2.初始装载。运行接口的驱动程序,将数据装入到数据仓库中。 3.桌面准备。桌面准备的主要工作是安装好所有需要的桌面用户工具,测试每个客户的计算机。 4.初始培训。这部分工作是让用户能够了解如何使用数据仓库。

文档评论(0)

zsmfjh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档