专家与决策支持系统课程.ppt

  1. 1、本文档共87页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专家与决策支持系统课程

6.1 数据仓库的基本原理 6.2 数据仓库系统 6.3 联机分析处理 6.4 数据仓库的决策支持 数据仓库工作范围和成本常常是巨大的。开发数据仓库是代价很高、时间较长的大项目。 提供更紧密集成的数据集市就应运产生。 目前,全世界对数据仓库总投资的一半以上均集中在数据集市上。 数据集市(Data Marts)是一种更小、更集中的数据仓库,为公司提供分析商业数据的一条廉价途径。 数据集市是指具有特定应用的数据仓库,主要针对某个应用或者具体部门级的应用,支持用户获得竞争优势或者找到进入新市场的具体解决方案。 独立数据集市(Independent Data Mart) 从属数据集市(Dependent Data Mart) 1、规模是小的 2、特定的应用 3、面向部门 4、由业务部门定义,设计和开发 5、由业务部门管理和维护 6、快速实现 7、购买较便宜 8、投资快速回收 9、工具集的紧密集成 10、更详细的、预先存在的数据仓库的摘要子集 11、可升级到完整的数据仓库 6.2 数据仓库系统 6.2.1数据仓库系统结构 数据仓库系统由数据仓库(DW)、仓库管理和分析工具三部分组成。 分析工具集分两类工具: (1)查询工具 数据仓库的查询不是指对记录级数据的查询,而是指对分析要求的查询。 一般包含: 可视化工具:以图形化方式展示数据,可以帮助了解数据的结构,关系以及动态性。 多维分析工具(OLAP工具): 通过对信息的多种可能的观察形式进行快速、一致和交互性的存取,这样便利用户对数据进行深入的分析和观察。 多维数据的每一维代表对数据的一个特定的观察视角,如时间、地域、业务等。 (2)数据挖掘工具 从大量数据中挖掘具有规律性知识,需要利用数据挖掘(Data Mining)工具。 数据仓库是以多维表型的“维表—事实表”结构形式组织的,共有三种形式: 1、星型模型 大多数的数据仓库都采用“星型模型”。 星型模型是由“事实表”(大表)以及多个“维表”(小表)所组成。 “事实表”中存放大量关于企业的事实数据(数量数据)。 星型模型数据如下图: 6.3.1 基本概念 1、OLAP的定义 3.多维概念视图 企业的数据空间本身就是多维的。因此OLAP的概念模型也应是多维的。 用户可以对多维数据模型进行切片、切块、旋转坐标或进行多维的联合(概括和聚集)分析。 4.稳定的报表性能 报表操作不应随维数增加而削弱,即当数据维数和数据的综合层次增加时,提供的报表能力和响应速度不应该有明显的降低。 5.客户/服务器体系结构 OLAP是建立在客户/ 服务器体系结构上的。 要求多维数据库服务器能够被不同的应用和工具所访问。 8.多用户支持 当多个用户要在同一分析模式上并行工作,需要这些功能的支持。 11.灵活的报表生成 报表必须充分反映数据分析模型的多维特征,并可按用户需要的方式来显示它。 6.3.2 OLAP的数据组织 MOLAP和ROLAP是OLAP的两种具体形式: ROLAP是基于关系数据库存储方式建立的OLAP。 多维数据映射成平面型的关系表。采用星型模型。 MOLAP是基于多维数据库存储方式建立的OLAP;表现为“超立方”结构,类似于多维数组的结构。 在分析中,需要“旋转”数据立方体以及“切片” 、“切块”等操作。 2、广义OLAP功能 1、基本代理操作 “代理”是一些智能性代理,当系统处于某种特殊状态时提醒分析员。 (1)示警报告 定义一些条件,一但条件满足,系统会提醒分析员去做分析。如每日报告完成或月定货完成等通知分析员作分析。 (2)异常报告 当超出边界条件时提醒分析员。如销售情况已超出预定义阈值的上限或下限时提醒分析员。 2、广义OLAP功能 2、计算能力 计算引擎用于特定需求的计算或某种复杂计算。 3、模型计算 增加模型,如增加系统优化、统计分析、趋势分析等模型,以提高决策分析能力。 假设有一个5维数据模型,5个维分别为:商店,方案,部门,时间,销售。 1.三维表查询 在指定“商店=ALL,方案=现有”情况的三维表(行为部门,列为时间和销售量) 确定体系结构 (1)来源:数据应该来自于什么DBMS的源数据? (2)传输:数据通过什么样的网络拓扑结构传送过来? (3)目

文档评论(0)

tangtianbao1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档