数据仓库理论学习笔记.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库技术与联机分析处理 Data Warehouse OLAP;数据库处理的两大应用 联机事务处理(OLTP) 决策支持系统(DSS);数据库处理的两大应用 联机事务处理(OLTP) 操作型处理,为企业的特定应用服务 是对数据库的联机的日常操作,通常是对一个或一组记录的查询和修改 人们关心的是响应时间、数据的安全性和完整性 决策支持系统(DSS);数据仓库的特点 面向主题 集成的 数据仓库的数据是从原有的分散数据库数据中抽取来的 消除数据表述的不一致性(数据的清洗) 数据的综合 数据???可更改 随时间变化的;数据仓库的特点 —— 集成;数据仓库的特点 面向主题 集成的 数据不可更改 数据仓库的主要数据操作是查询、分析 不进行一般意义上的数据更新(过期数据可能被删除) 数据仓库强化查询、淡化并发控制和完整性保护等技术 随时间变化的;数据仓库的特点——数据不可更改;数据仓库的特点 面向主题 集成的 数据不可更改 随时间变化的 不断增加新的数据内容 不断删除旧的数据内容 定时综合 数据仓库中数据表的键码都包含时间项,以标明数据的历史时期;数据仓库的特点 ——随时间变化;数据仓库的结构;数据仓库的结构 数据由操作型环境(综合)导入数据仓库 数据具有不同的细节级 早期细节级(过期数据) 当前细节级 轻度综合数据级(数据集市) 高度综合数据级 ;数据仓库建立的过程;粒度 是指数据仓库的数据单位中保存数据的细化或综合程度的级别 粒度级越小,细节程度越高,综合程度越低,回答查询的种类越多 粒度影响数据仓库中数据量的大小 粒度问题是设计数据仓库的一个重要方面 双重粒度 在数据仓库的细节级上创建两种粒度 短期储存的低粒度(真实档案),满足细节查询 具有综合的高粒度(轻度综合),做分析;分割 是指把数据分散到各自的物理单元中去,以便能分别独立处理,提高数据处理效率 是粒度之后的第二个主要设计问题 两个层次的分割 系统层:DBMS,一种定义 应用层:开发者,多种定义 多种分割的标准 日期:最常用的 地理位置 组织单位…...; ;数据仓库中的数据组织形式 简单堆积 轮转综合 数据按一定的格式进行轮转的累加 简化直接 按一定的时间间隔,对数据进行提取,是操作型数据的一个快照 连续 把新的快照追加到以前的连续数据上去 ;数据仓库中的数据组织形式 简单堆积 每日由数据库中提取并加???的数据逐天积累堆积;数据仓库中的数据组织形式 轮转综合 数据按一定的格式进行轮转的累加;数据仓库中的数据组织形式 简单堆积与轮转综合的比较;数据仓库中的数据组织形式 简化直接 按一定的时间间隔,对数据进行提取,是操作型数据的一个快照;数据仓库中的数据组织形式 连续 把新的快照追加到以前的连续数据上去 ;数据仓库的数据追加 数据追加 数据仓库的数据初装完成以后,再向数据仓库输入数据的过程称为数据追加 变化数据的捕获 时标法:加标识 DELTA法:对更新作记录 前后映象法:两次快照的对比 日志法:利用DBMS的日志,需改进 ;数据库的体系化环境 是在一个企业或组织内部,由各面向应用的OLTP数据库及各级面向主题的数据仓库所组成的完整的数据环境 操作型环境、分析型环境 四层体系化环境 操作型环境——OLTP 全局级——数据仓库 部门级——局部仓库 个人级——个人仓库,用于启发式的分析 数据集市(Data Mart) 特定的、面向部门的小型数据仓库 是为满足用户特定需求而创建的数据仓库 是数据仓库的子集;数据库的体系化环境;数据库的体系化环境;数据仓库的开发生命周期;数据仓库的基本数据模式 星型模式(Star Schema) 事实表(fact table),存放基本数据,相关主题的数据主体(BCNF) 维(dimension),影响、分析主体数据的因素 量(measure),事实表中的数据属性 维表(dimension table),表示维的各种表 维是量的取值条件,维用外键表示 以事实表为中心,加上若干维表,组成星型数据模式 例:产品-商店-销售额;数据仓库的基本数据模式;数据仓库的基本数据模式 雪花模式(Snowflake Schema) 维一般是由若干层次组成 把维按其层次结构表示成若干个表 规范化、节省存储空间 但需多做连接操作;数据仓库的解决方案 通用的关系数据库系统 专门的数据仓库服务器;数据仓库系统的体系结构 数据仓库层 数据仓库工具层 最终用户;数据仓库系统 数据仓库 居系统的核心地位 是信息挖掘的基础 数据仓库管理系统 是整个系统的引擎 负责管理整个系统的运转 数据仓库工具 一般的查询工具、功能强大的分析工具 是整个系统发挥作用的关键;数据仓库系统;数据仓库系统;数据分析模型 早期 静态数据值的相互比较 需求 从多个不同的数据源中综合数据 从不同的角度观察

文档评论(0)

老师驿站 + 关注
官方认证
文档贡献者

专业做教案,有问题私聊我

认证主体莲池区卓方网络服务部
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0GFXTU34

1亿VIP精品文档

相关文档