- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据仓库的策支持系统技术
基于数据仓库的决策支持系统技术
一 发展概述
管理信息系统(MIS)为信息处理提供强大的数据处理和存储能力。
早期信息系统主要是为实现业务而建立的,根据业务的需要建立大量独立的系统。
多个独立的系统间要交互数据很困难,出现了“抽取”的模式。其特点是与信息系统无关,直接对信息系统的数据源进行“抽取”。
“抽取”产生的问题是产生的网状“抽取”,即在“抽取”的基础上再“抽取”。
产生数据仓库技术理论来规范。
信息系统1
信息系统1
信息系统2
信息系统n
ETL
数据集成
调度机制
。。。
数据仓库
DSS
数据应用
。。。
(DSS:决策支持系统)
方法的变迁
原始数据/操作型数据 导出数据/ D S S数据
? 面向应用 ? 面向主题
? 详细的 ? 综合的,或提炼的
? 在存取瞬间是准确的 ? 代表过去的数据
? 为日常工作服务 ? 为管理者服务
? 可更新 ? 不更新
? 重复运行 ? 启发式运行
? 处理需求事先可知 ? 处理需求事先不知道
? 生命周期符合S D L C ? 完全不同的生命周期
? 对性能要求高 ? 对性能要求宽松
? 一个时刻存取一个单元 ? 一个时刻存取一个集合
? 事务处理驱动 ? 分析处理驱动
? 更新控制主要涉及所有权 ? 无更新控制问题
? 高可用性 ? 松弛的可用性
? 整体管理 ? 以子集管理
? 非冗余性 ? 时常有冗余
? 静态结构;可变的内容 ? 结构灵活
? 一次处理数据量小 ? 一次处理数据量大
? 支持日常操作 ? 支持管理需求
? 访问的高可能性 ? 访问的低可能性或适度可能性
二 数据仓库环境
1 概述
数据仓库是决策支持系统(DSS)的基础。
是面向主题的、集成的、非易失的,且随时间变化的数据集合。
面向主题:相比操作型系统是面向业务的或某一功能的(如产品检测、质量审核等),面向主题是针对某一类数据主体(如产量、合格量等)。
集成性:将多个数据表述转换为简单的形式(粒度、分割、简要)。
非易失性:数据仓库中的数据载入后,保存时间长、不存在传统意义上的更新操作。
随时间变化:数据仓库按时间将操作型数据抽取装载(所以表的主键一般都包含时间)。
操作型环境是:面向业务应用的、松散的、易失的,反应当前时间点的数据集合。
数据仓库反映的是对信息的历史需求,而操作型环境是体现对信息目前的需求。
数据仓库着眼于企业的信息化需求,而操作型环境则着眼于精确到秒的企业日常事务需求。
操作型数据
操作型数据
数据仓库
插入
修改
删除
访问
时间期限:当前到6 0~9 0天
记录更新
键码可能包含时间元素
时间期限:5-10年
数据的复杂快照
键码一般都包含时间元素
载入
访问
2 结构
数据总体分类:
操作型
操作型环境
数据仓库
原子级
部门级
数据集市
个体
数据仓库中的数据的级别:
早期细节级
早期细节级
(备用、批量载入)
当前细节级
元
数
据
数据过期
数据转换载入
轻度综合级
(数据集市)
高度综合级
(主题应用)
数据综合
数据综合
3 主题
数据仓库的数据模型体现公司定义好的主要主题领域。
主题
主题(如顾客)
关联信息
如:商品
送货地址
账目
事务或活动
如:订单
评价
登陆
数据仓库数据模型定义中,是以“公共键码”和“时间元素”复合作为键码的。
4 粒度与分割
粒度与分割是在数据仓库中分层次存储数据的方法,针对不同的主题和性能需求进行数据的集成处理和存储。主要的目的是为了使不需要的数据不出现的分析中,也就是使数据量变小。
粒度与细节级有关,如“每月通话详细清单”与“每月通话综合”,前细后粗,则粒度前低后高。
多维度分割逻辑分割
多维度分割
逻辑分割:程序实现
物理分割:数据库实现
细节粒度设计
4.1 粒度
文档评论(0)