数据仓库与数据挖掘数据仓库的设计资料.ppt

数据仓库与数据挖掘数据仓库的设计资料.ppt

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库 与数据挖掘 冯海旗 数据仓库的设计 */16 */16 数据仓库的需求与规划 数据仓库是企业信息系统中最为复杂的部分。 从数据仓库使用和构建过程本身看, 数据仓库系统汇集了来自众多业务系统的数据, 需要支持多个层次、不同用户的决策需求 需要适应业务的不断变化, …… 数据仓库的用户一般是企业的中上层管理人员或幕僚,他们对决策分析的需求不能预先做出规范的说明,只能给设计人员一个抽象的(模糊的)描述。 */16 数据仓库的需求与规划 从使用角度看,需要多方面的技巧 商业技巧。业务技巧有助于了解数据仓库中所含数据的意义和重要性。能够更好地了解管理决策需要,并将这种需要转换成数据仓库要解决的问题 领域知识。与管理活动有关,将决策观点转化成精确的管理需求,进而转化成解决方案,并对数据查询或挖掘的结果进行分析、利用。 数据分析技巧。包括从大量数据中提炼出有价值的信息发现新的模式和趋势、找出差异、展示管理上的可取之处。这些技巧部分来自数学、统计学、管理学、心理学,部分来自直觉和经验。 */16 数据仓库的需求与规划 从涉及的技术角度 各种新技术 商业平台 分析工具 新型数学方法 */16 应用需求 (数据、处理) 转换规则、 DBMS功能、 优化方法 需求收集和分析 设计概念结构 设计逻辑结构 数据模型优化 设计物理结构 评价设计,性能预测 物理实现 试验性运行 使用、维护数据库 应用要求, DBMS详 细特征 需求分析阶段 概念设计阶段 逻辑设计阶段 物理设计阶段 数据库实施阶段 数据库运行、维护阶段 不满意 不满意 数据库的开发流程 */16 2. 数据仓库的开发流程 (1)数据仓库规划分析阶段,在该阶段的工作内容主要包括: 分析数据仓库应用环境,调查数据仓库开发需求,完成数据仓库的开发规划。 建立包括实体关系图、星型模型、雪花模型、元数据模型以及数据源分析的主题区数据模型,并根据主题区数据模型开发数据仓库逻辑的模型。 */16 2. 数据仓库的开发流程(2) (2)数据仓库设计实施阶段,在该阶段的工作内容主要包括: A.按照数据仓库的逻辑模型设计数据仓库的体系结构。 B.设计数据仓库的物理数据库。 C.用物理数据库元数据填充面向最终用户的元数据库。 D.对数据仓库中每个目标字段确认其在业务系统或外部数据源中的数据来源。 E.开发(或购买)用于抽取、清洁、交换和合并数据等中间件的程序。 F.将数据从现有系统中传送到仓库中。 */16 2. 数据仓库的开发流程(3) (3)数据仓库的使用维护阶段,在该阶段的工作内容主要包括: A.将数据仓库投入实际应用,并在应用中改进和维护数据仓库。 B.对数据仓库进行效益评价,以为下一个循环提供依据。 */16 数据仓库的生命周期开发应用全过程 开发概 念模型 规划与 确定需 求 数据仓 库评价 数据 仓库 维护 数据 仓库 应用 填充与 测试数 据仓库 开发 中间 件 确定 数据 抽取源 数据库 与元数 据设计 设计 体系 结构 开发 逻辑 模型 数据仓库 开发过程 规划 分析阶段 设计实 施阶段 使用维护 阶段 */16 数据仓库的开发的需求分析 (1)业主需求的分析 数据仓库的业主关心的是创建数据仓库的目标,建立数据仓库给组织战略带来的影响,创建数据仓库所需的投资费用以及所具有的应用前景。业主常常参与数据仓库概念模型的认可和评审,批准开发方案,为系统以后的不断升级和连续投资进行决策。 */16 数据仓库的开发的需求分析(2) (2)设计者需求的分析 数据仓库设计者不但要收集业主对数据仓库的需求,还要收集实现这些需求所需的技术要求。设计者介于投资者和实现者之间。 企业结构规划(EAP)法是用于结构设计的一种最有效的方法,在该法中,设计者可以实现以下3种结构。 A.数据结构。 B.应用程序结构。 C.技术结构。 */16 数据仓库的开发的需求分析(3) (3)开发者需求的分析 开发者负责数据仓库各个构件的物理安装和集成。 开发者需求进一步包括如下四个方面: A.技术需求 B.使用需求 C.数据仓库产品就绪需求 D.开发与使用人员及其技术需求 */16 数据仓库的开发的需求分析(4) (4)最终用户需求的分析 数据仓库相对最终用户而言是一个黑箱,他们只能通过查询、报表工具和数据仓库内部信息的某种影射关系来访问数据仓库内部数据。因而,最终用户的需求主要体现在对工作流程的分析、决策的查询需求、报表需求、操作需求和数据需求等方面。同时,在进行数据仓库的最终用户需求分析时,还需要对数据仓库的主题域、信息的粒度、数据仓库的维度进行分析。 */16 开发策略与目标 开发策略主要有: 自顶向下:实际应用比较困难 。 自底向上:用于一个数据集市或一个部门的数

文档评论(0)

三四五 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档