1数据仓库基础答辩.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库回答的问题 数据仓库技术将为高层管理人员的科学决策提供可靠依据 去年各个地区各产品的销售量和销售额? 10年以来,哥哥计算机厂商每个季度的销售额占有比例的变化情况? 如果某种产品的销售价格打9折,利润将发生怎样的变化? 今年销售量下降的主要因素(时间、地区、商品、销售部门)是什么? 数据仓库的特点 Integrated Time-variant Nonvolatile Subject- oriented Data Warehouse 面向主题的数据组织 OLTP Applications Equity Plans Shares Insurance Loans Savings Data Warehouse Subject Customer financial information Data is categorized and stored by business subject rather than by application. 面向主题的数据组织的特点 各个主题有完整、一致的信息内容,便于在此基础上作分析处理 主题之间有重迭的内容,反映主题间的联系 重迭是逻辑上的,不是物理上的;重迭仅在细节层 各主题的综合方式不同 主题域应该具有独立性、完备性 独立性:有明确界限,数据是否属于该主题 完备性:对该主题进行分析所涉及的内容均要在主题域内 面向主题数据组织的实现 多个表,公共码键(把各个表统一联系起来),但同一主题的表可存放在不同介质上 综合信息,多个层次 面向主题数据组织方式独立与数据的事务处理逻辑。既可以支持分析型数据环境,又可用于操作数据存储系统 集成的数据 操作型数据库 数据仓库 面型特殊应用 集成的 每一个数据库面向特定的应用,各类应用之间相互独立 数据仓库中的数据从建立时开始,面向真个企业的分析处理,数据仓库中的数据是已经集成了的,消除了数据的不一致性 系统的发展经历一个长期的过程 在某个时间点完成设计,实现需要经历一个长期的不断迭代的过程 集成的数据 消除冲突:不一致,同名异义、异名同义、单位不统一等等,需要进行数据清理 数据的综合和计算 Data Warehouse OLTP Applications Savings Current Accounts Loans Customer 反映历史变化 操作型数据库 数据仓库 60-90天数据 5-10年数据 记录能被更新 数据的复杂快照 码中不一定包括时间元素 码中包括时间元素 主要关心当前数据 通常关心历史数据 Data Warehouse 反映历史变化 码键包含时间项 不断增加新的数据内容 删除过时的数据 与时间有关的综合数据:随时间变化而重新组合 相对稳定 操作型数据库 数据仓库 实时更新 在某个时间点保持不变 随时更新 定期加载,加载后的数据极少更新 数据根据需要进行变化,并不是按照一定周期进行修改 并不意味这数据仓库中的数据不更新 Read Load Insert, Update, Delete, or Read 相对稳定 Operational Databases Warehouse Database First time load Refresh Refresh Refresh Purge or Archive 数据仓库、OLTP 数据库对比 Property OLTP Data Warehouse Response Time Sub seconds to seconds Seconds to hours Operations DML Primarily Read only Nature of Data 30 – 60 days Snapshots over time Data Organization Application Subject, time Size Small to large Large to very large Data Sources Operational, Internal Operational, Internal, External Activities Processes Analysis 数据仓库基础 数据仓库基本概念 数据仓库技术产生背景 什么是数据仓库技术 数据仓库技术与相关技术的比较和联系 信息技术发展的几个阶段 1960s:数据采集、数据库创建阶段 基于原始文件的数据处理 层次数据库和网状数据库 1970s:关系数据库管理系统 E-R模型、SQL语言、查询处理和优化、OLTP 1980s:高级数据库管理系统 面向对象数据库、时空数据库、统计数据库 1990s:数据仓库、联机分析和数据挖掘 OLTP数据系统的侧重点 现有数据库系统主要用于事务处理 一笔存款 一笔取款 一笔转账 强调多

文档评论(0)

***** + 关注
实名认证
内容提供者

我是自由职业者,从事文档的创作工作。

1亿VIP精品文档

相关文档