- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 数据仓库的设计与实施 3.1 从数据库到数据仓库 3.2 面向主题的数据仓库设计 3.2.1 数据建模 3.2.2 星型连接 3.3 开发数据仓库的物理设计 3.3.1 数据仓库设计工具的选择 3.3.2 物理数据模型设计 3.3.3 数据仓库中数据表的数量与规范化 3.4 数据仓库的实施 3.4.1 数据仓库的实施应注意的问题 3.4.2 在实施数据仓库过程中应避免的错误 3.4.3 数据仓库项目实施成功的要诀 思考练习题三 3.1 从数据库到数据仓库 3.2.1 数据建模 1)数据仓库的开发过程 2)基于开发过程的数据建模型的主要内容 3.2.2 星型连接 3.3.1数据仓库设计工具的选择 1.数据获取工具的选择 2.数据工具的选择 3.3.2 物理数据模型设计 硬件平台的选择:数据仓库的硬盘容量通常是操作数据库硬盘容量的2~3倍。选择硬件平台时要考虑的问题:是否提供并行的I/O?对多CPU的支持能力如何? 不同存储介质的特点比较表 3.3.3 数据仓库中数据表的数量与规范化 在数据模型处理过程中,如果程序在很多表中跳转,每次程序从一个表跳到另一个,就要进行I/O变换,既要存取数据,又要存取索引找到数据。如果许多程序需要大量的I/O时,性能就会受到影响,这就要进行小计。 当数据序列产生的数量是稳定的、按序列存取的,且数据的创建与修改在统计上是以很规律的方式进行的时候,可以采用数据数组。 3.4.1 数据仓库的实施应注意的问题 在数据仓库的实施过程中要考虑以下问题:投资回报率;在具体实施时应自顶向下还是自下到上;在人力资源的问题上要考虑培训还是雇用;在设计上要有前瞻性,把问题覆盖的范围思考大一些,但实施从小处开始。 3.4.2 在实施数据仓库过程中应避免的错误 1.错误项目的发起 2.制订了不可能完成的目标 3.犯政治幼稚病 4.把所有能找到的数据全都放到数据仓库中 5.认为设计数据仓库就是设计事务数据库 6.选择一个面向技术的而不是面向用户的人做数据仓库项目经理 7.只专注内部关系型数据,而忽略外部数据、文本、图像甚至声音、视频数据 8.用交叠的或冲突的数据定义交付数据 9. 相信软硬件供应商对性能、能力和可扩展性的承诺 10.相信一旦数据仓库建立起来并开始运行,你的任务就完成了 11.专注于动态生成查询、数据挖掘和定期生成报表 3.4.3 数据仓库项目实施成功的要诀 许多数据仓库项目的指导方针都是成功的。Anahory和Murray提供了足有145组指导方针,所有这些都是为了那些负责数据仓库项目的人而设计的,目的是帮助他们得到成功的结论。 数据仓库专家Larry Greenfield已经出版了他关于一个成功数据仓库项目的建议,下面是给仓库建造者的一些建议(/larryg/index.html) * * Istitute Of MIS And LMS,wuse 少 增、删、改频繁 更新操作 无 大 更新开销 无 需要附加数据空间 自由空间 完善结构 有限数量 索引 系统的决策与分析 事务处理和访问 优化 简单 复杂 功能 分析和一般查询 数据查询、开发 工具 面向OLAP应用 面向OLTP应用 面向应用 数据驱动 需求驱动 系统开发方法 实视图存储 虚表存储,只存视图结构 视图机制 面向主题 面向应用 数据组织方式 分析型数据 操作型数据 数据类型 数据仓库系统 数据库系统 便宜 慢 缩微胶片 不贵 不慢 光盘 适中 快 DASD 贵 非常快 高速缓存 贵 非常快 扩展内存 非常贵 非常快 主存 价格 速度 存储介质 *
文档评论(0)