基于数据仓库的策支持系统技术.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据仓库的策支持系统技术

基于数据仓库的决策支持系统技术 一 发展概述 管理信息系统(MIS)为信息处理提供强大的数据处理和存储能力。 早期信息系统主要是为实现业务而建立的,根据业务的需要建立大量独立的系统。 多个独立的系统间要交互数据很困难,出现了“抽取”的模式。其特点是与信息系统无关,直接对信息系统的数据源进行“抽取”。 “抽取”产生的问题是产生的网状“抽取”,即在“抽取”的基础上再“抽取”。 产生数据仓库技术理论来规范。 信息系统1 信息系统1 信息系统2 信息系统n ETL 数据集成 调度机制 。。。 数据仓库 DSS 数据应用 。。。 (DSS:决策支持系统) 方法的变迁 原始数据/操作型数据 导出数据/ D S S数据 ? 面向应用 ? 面向主题 ? 详细的 ? 综合的,或提炼的 ? 在存取瞬间是准确的 ? 代表过去的数据 ? 为日常工作服务 ? 为管理者服务 ? 可更新 ? 不更新 ? 重复运行 ? 启发式运行 ? 处理需求事先可知 ? 处理需求事先不知道 ? 生命周期符合S D L C ? 完全不同的生命周期 ? 对性能要求高 ? 对性能要求宽松 ? 一个时刻存取一个单元 ? 一个时刻存取一个集合 ? 事务处理驱动 ? 分析处理驱动 ? 更新控制主要涉及所有权 ? 无更新控制问题 ? 高可用性 ? 松弛的可用性 ? 整体管理 ? 以子集管理 ? 非冗余性 ? 时常有冗余 ? 静态结构;可变的内容 ? 结构灵活 ? 一次处理数据量小 ? 一次处理数据量大 ? 支持日常操作 ? 支持管理需求 ? 访问的高可能性 ? 访问的低可能性或适度可能性 二 数据仓库环境 1 概述 数据仓库是决策支持系统(DSS)的基础。 是面向主题的、集成的、非易失的,且随时间变化的数据集合。 面向主题:相比操作型系统是面向业务的或某一功能的(如产品检测、质量审核等),面向主题是针对某一类数据主体(如产量、合格量等)。 集成性:将多个数据表述转换为简单的形式(粒度、分割、简要)。 非易失性:数据仓库中的数据载入后,保存时间长、不存在传统意义上的更新操作。 随时间变化:数据仓库按时间将操作型数据抽取装载(所以表的主键一般都包含时间)。 操作型环境是:面向业务应用的、松散的、易失的,反应当前时间点的数据集合。 数据仓库反映的是对信息的历史需求,而操作型环境是体现对信息目前的需求。 数据仓库着眼于企业的信息化需求,而操作型环境则着眼于精确到秒的企业日常事务需求。 操作型数据 操作型数据 数据仓库 插入 修改 删除 访问 时间期限:当前到6 0~9 0天 记录更新 键码可能包含时间元素 时间期限:5-10年 数据的复杂快照 键码一般都包含时间元素 载入 访问 2 结构 数据总体分类: 操作型 操作型环境 数据仓库 原子级 部门级 数据集市 个体 数据仓库中的数据的级别: 早期细节级 早期细节级 (备用、批量载入) 当前细节级 元 数 据 数据过期 数据转换载入 轻度综合级 (数据集市) 高度综合级 (主题应用) 数据综合 数据综合 3 主题 数据仓库的数据模型体现公司定义好的主要主题领域。 主题 主题(如顾客) 关联信息 如:商品 送货地址 账目 事务或活动 如:订单 评价 登陆 数据仓库数据模型定义中,是以“公共键码”和“时间元素”复合作为键码的。 4 粒度与分割 粒度与分割是在数据仓库中分层次存储数据的方法,针对不同的主题和性能需求进行数据的集成处理和存储。主要的目的是为了使不需要的数据不出现的分析中,也就是使数据量变小。 粒度与细节级有关,如“每月通话详细清单”与“每月通话综合”,前细后粗,则粒度前低后高。 多维度分割逻辑分割 多维度分割 逻辑分割:程序实现 物理分割:数据库实现 细节粒度设计 4.1 粒度

文档评论(0)

138****7331 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档