- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 数据仓库开发应用过程 与传统的DB开发一样,DW的开发也经历需求分析、概念模型设计、逻辑模型设计和物理模型设计;其不同之处——数据量以及数据操作不同,此外,前者在需求分阶段就能确定系统的功能,后者则不能。 §1 DW开发应用的特点 §2 DW的规划 §3 DW概念模型设计 §4 DW逻辑模型设计 §5 DW物理模型设计 §6 DW的实施 §7 DW的应用、支持和增强 §1 DW开发应用的特点 DW的开发也具有其特有的、完整的生命周期——DW规划分析阶段、DW设计实施阶段以及DW使用维护阶段。该三个阶段将循环往复,直至一个完善的DW开发完毕。 1.DW开发的阶段性 借鉴Nolan阶段模型,可以将DW的开发阶段划分为:创始阶段、成长阶段、控制阶段和成熟阶段等四个阶段。[课后阅读] 2.DW的螺旋式开发方法 如前所述,DW的一个生命周期包含三个阶段。然而,一个完善的DW需要经历若干个生命周期完成——每个DW生命周期积累的经验,一方面可以用于未来其他主题的开发应用,另一方面,可以用于完善原DW。 上述过程便构成了数据仓库的螺旋式开发方法,该方法是目前DW开发的主要方法。 DW的螺旋式开发方法 3.数据仓库开发的特点 ? 数据驱动的设计方法 ① 用业务系统的数据创建DW DB系统有什么→对DW有何影响; DB数据→主题领域[联系]; 数据模型→DB与主题数据的共同性。 ② 该方法不是面向应用的,即,不是从应用需求出发的。 ? 开发初期使用需求的不确定性 DB系统,面向应用,其设计有一组确定的应用需求做为参照; DW无对应的、固定的物流、信息流、数据流等,导致数据的分析处理没有固定的模式,甚至用户自己都不知道其将来的分析处理的过程,所以,难以在初期确定DW的使用需求。 ? 不断循环的启发式过程 DW的开发是一个动态反馈的、启发式的循环过程: 一方面,DW的数据内容、结构、数据粒度、分割及其他物理模型及其设计需根据用户的反馈信息不断调整和完善,以提高系统的效率和性能; 另一方面,通过不断理解用户的决策分析需求,来调整和完善DW,以提供更为准确的决策信息。 §2 DW的规划 规划是DW开发的首要任务,它包括选择DW实现策略、确定DW开发目标和实现范围、选择DW体系结构以及建立DW使用方案和项目规划预算四个方面。 上述规划工作完成后,要编制DW规划说明书,内容包括DW与企业战略规划之间的关系,DW重点支持的职能部门,对DW开发工作的建议,实际使用方案与开发预算等。 1.选择DW实现策略 主要有自上而下、自下而上以及混合策略三种。 ① 自上而下策略 ? 应用于DW较难——需求难以定义; ? 较为死板——需预先确定目标; ? 需开发人员具有丰富的自上而下开发系统的经验,以及管理人员与决策者完全知晓DW的目标及作用; ? 适合采用结构化或OO开发方法。 ② 自下而上策略 ? 较灵活——一般从某个原型开始,常用于开发数据集市; ? 一般用于试点[对DW技术的评价,运行DW的各种费用等]; ? 适合采用螺旋式的原型开发方法。 ③ 混合策略 难以操作——需要精通方方面面的专家。 2.确定DW的开发目标和实现范围 为此,需要对用户说明DW应用和发展趋势以及对企业经营战略的支持。 开发目标: ? 确定信息的范围[主题域/指标域]; ? 确定访问和导航数据的方法和工具 包括聚集及概括工具,访问检索图表、预定义报表、统计分析器等的工具等等; ? 确定DW数据的规模。 其他目标还有:根据需求确定数据的含义,确定DW的类型,确定DW的功能,确定元数据的数量,确定数据源的使用,……。 可见,DW的目标非常繁多复杂,需开发人员与用户不断交流来确定。 实现范围: 基于用户的角度 ? 谁[人员/部门]使用DW; ? DW有哪些查询——它们确定了概括、聚集、集成、重构等的技术要求以及报表的种类等。 基于技术的角度 ? 确定DW的元数据库的规模——间接地确定了DW要管理的数据量。 3.选择DW的体系结构 一般基于DW的应用结构和DW的技术平台结构两个方面来考虑。 ① DW的应用结构 ? 基于业务处理系统的DW——虚拟DW; ? 单纯DW(所有应用都在DW中进行); ? 单纯数据集市(部门级DW); ? DW与数据集市(最佳体系结构)。 ② DW的技术平台结构 ? 单层结构——数据源与DW共享
文档评论(0)