中文LES09 规划数据仓库的存储 数据仓库 中文oracle99版培训资料.pptVIP

中文LES09 规划数据仓库的存储 数据仓库 中文oracle99版培训资料.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文LES09 规划数据仓库的存储 数据仓库 中文oracle99版培训资料.ppt

规划数据仓库的存储 总述 项目管理 (方法论, 维持元数据) 定义数据仓库的 概念及术语 规划一个成功 的数据仓库 分析用户 查询需求 选择一个处理 体系结构 建模数据仓库 规划数据仓库 存储 ETT (构建数据仓库) 满足业务需求 管理数据仓库 支持最终 用户存取 目标 在完成这一课后,你应该能够做到以下几点: 讨论不同的分割方法和索引方法 考虑不同的RAID(廉价冗余磁盘阵列)等级在保护数据库方面的好处和局限性 数据分割 数据分割使得它们成为 能够独立处理的物理单位 容易做: 重构 重组 删除 恢复 监视 管理 存档 索引 Feb 98 Mar 98 添加 丢弃 命令表 其它数据不受影响 Jan 98 分割的对象 表: 事实表 维表 索引 分割方法 范围分割(Oracle8 和Oracle8i) 哈希分割(Oracle8i) 复合分割(Oracle8i) 范围分割 哈希分割 复合分割 星型查询的最佳化 星型模型的最佳性能 1. 创建用来被查询的维表 2. 使用笛卡尔积, 逆向计算 3. 更小的参考表 4. 结果被进行连接操作 5. 事实表产生查询结果 = 查询结果 1 2 3 4 5 星型转换 STAR_TRANSFORMATION_ENABLED Key 1 Key 2 Key 3 Key 1 Key 2 Key 3 Product_Table Market_Table Time_Table Dollars Fact_Table Year Month Stat Brand 1002 1001 1003 March 1998 ABC SF 6000 索引 使用索引是因为: 节省巨大的成本,极大地提高性能和可测量性 可通过只读一个包括所需行的磁盘块指引的索引代替一个整表的扫描 通过读索引,而不是查询整张表,可以快速地找到需要查询的行在磁盘中的位置。 B-树 索引 最普通的索引类型 被用于具有较多的列 返回行数少 位图索引 优化性能和节省存储空间 存储值仅为 1和 0 当出现以下情况时,通常使用位图索引而非B-树索引: 表很大 列数相对低维 位图索引的产品颜色 Blue - 1000100100010010100 Green - 0001010000100100000 Mauve - 0100000011000001001 Gold - 0010001000001000010 Oracle 8 和Oracle8i 索引的改进 Oracle8 索引改进: 分割索引 被组织的索引表 Oracle8i 索引改进: 基于功能的索引 改进的新位图索引 联机索引创建和重建 降序索引 当索引建立时可收集统计数据 保护数据库 大型数据库必须有RAID(廉价冗余磁盘阵列) RAID 改善了: 可靠性 存储管理 RAID有不同的级别 可以通过磁盘分块避免磁盘使用的竞争 RAID 0: 分块 文件被写到一个四驱动器的磁盘序列中: 块 1 在驱动器 1 块 2 在驱动器 2 . . . 块5 在另一个扇区的驱动器1上 文件A (a) 文件A (e) 文件A (b) 文件A (f) 文件A (c) 文件A (d) 磁盘阵列控制器 RAID 0:分块 优点: 对同时读写有益 无冗余 可升级 局限: 不推荐用于关键任务系统 数据丢失的时候不能恢复 一个坏扇区影响到整个磁盘的数据 RAID 1: 镜像 复制的文件存储在镜像磁盘里 磁盘阵列控制器 磁盘 1 磁盘1 Mirror 磁盘2 磁盘2 Mirror 文件 A (a) 文件A (b) 文件A (a) 文件A (b) RAID 1: 镜像 优点: 完全的数据冗余 无性能损失 改善读取 具有可测量性 局限: 在RAID的所有配置中成本最高 RAID 5: 独立的磁盘阵列 使用奇偶交叉排序使数据分块 File C (b) File C (e) P (d,e,f,g,h) File C (a) File C (d) File (h) P (i,j) File C (c) File C (f) File C (i) P (a,b,c) File C (g) File C (j) 磁盘阵列控制器 磁盘 1 磁盘 2 磁盘 3 磁盘4 RAID 5: 独立的磁盘阵列 优点: 有效的数据整合 数据重建 多并发寻求交叉阵列 可升级的 局限: 磁盘重叠 数据写入比率 仓库典型的使用RAID 0, 1, or 5 备份 在设计阶段规划 为 VLDBs使用热备份 备份必需的构件: 事实表和维表中的数据 仓库模式 元数据模式 元数据 输入/输出工具 磁盘空间 时间 总结 本节讨论了以下课题: 解释垂直

文档评论(0)

yuzongxu123 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档