个人对数据仓库理解.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
个人对数据仓库理解

数据仓库 (一)、数据仓库这个概念的兴起 30年前,所有的美国的任何行业都轰轰烈烈的进行着信息化的活动。各种业务活动都由电脑处理,叫做“业务系统”。必然的,所有业务系统里都有查询统计功能。 20年前,随着电脑化的业务系统里存储的历史数据逐渐增加,他们发现查询历史数据或者做业务统计的速度越来越慢。对业务数据统计分析的需求也越来越复杂。业务系统已经不堪重负。于是很多公司就把,业务系统里的历史数据拿出来,放在另一个地方,专门负责对历史数据的查询统计分析。这个工作显得越来越重要,也越来越有企业肯花钱来做,也越来越有人认真的研究怎么把查询统计分析的工作做好。 10多年前,开始美国人开始有人起名字,就叫“数据仓库”。 (二)、数据仓库的概念是针对以下基本需求产生 公司的业务系统很多,业务系统的历史数据不方便查询。不同的业务系统往往管理部门不同,地域不同。能不能将所有这些数据集中起来,再淘淘有没有有意义的业务规律。 总之,一点,一个公司想针对已有的历史业务数据,充分的利用它们,那么就上数据仓库项目。 (二)、数据仓库系统(用数据库装东西)与其他基础业务系统(例如财务系统、销售系统、人力资源系统等,也是用数据库装东西)的区别 基础业务系统的特点是各管各的,例如财务系统生产了白菜,那么用一个数据库来装,人力资源系统生产了猪肉,再用一个数据库来装。我要做一道菜,需要分别到各个数据库去取,比较麻烦(现实的情况是大部分时候让种菜的农民伯伯送过来,但送过来的东西不一定是我想要的,而且不同的时候我想要不同的东西,经常会被农民伯伯骂,弄得双方都不开心)。另外一方面,各个数据库中放的是一些比较原始的东西,我要拿过来做菜,还需要经过很麻烦的清洗过程,一不小心里面可能就藏着一条大青虫。 那么,数据仓库系统就是建立一个大的超市(注意别建成垃圾堆),将各地农民伯伯出产的东西收集过来,清洗干净,分门别类地放好。这样,你要哪种菜的时候,直接从超市里面拿就可以了。 另外,数据仓库还会起到历史数据分类归档??目的(就像图书馆一样),届时可以通过检索条件方便的查询历史信息。 (四)、概念 简单滴说,数据仓库就是整合各生产系统的数据特征,通过对历史数据、当前生产数据进行抽取、清洗、分类,从多角度分析生产系统数据特征,得出企业经营状况并对未来发展进行预测,为企业管理者的经营决策提供依据。 宏观一点讲,数据仓库就是堆放公司所有数据的地方,之所以把数据都堆在一起,是为了从中间找到有价值的东西。数据仓库的物理上就是数据库。相对业务系统数据库叫OLTP数据库(用于业务处理),这种数据库叫OLAP数据库(用于业务分析)。 数据仓库(DATA WAREHOUSE/DATA MART)的另一重要概念是数据从不同的数据库(DATABASES) 里调出经过ETL工具(如POWERCENTRE,DECISIONSTREAM, SQL SERVER 2000 DTS, SQL SERVER 2005 SSIS)过程进行清理,确证,整合并设计成多维(dimensional framework)。以保证数据的正确、准确、完整, 这是非常重要的一点。 数据仓库的作用重在数据的集中管理。集中管理的最终目的是为了分析,预测。所谓的ETL。不过是数据仓库的构建的一个必须过程。数据的抽取转换与装载,都是为了集中管理所做的基础工作,这些数据与动作的描述,都会有有响应的元数据进行描述。 数据仓库,整合各业务系统的数据特征,通过对生产数据进行抽取、清洗、分类成“面向主题的、集成的、稳定的、随时间变化的”数据集合,用于决策支持的数据库系统。 (五)数据仓库通过分析数据(包括报表、OLAP、挖掘),能把分析出来的东西找出来,就可以对症下药,采取措施。 比如某品牌产品,在某代理商代理的销售中,在某地区某季度业绩很差,于是在下钻分析,分析出销售中第几步出了问题,分析出问题是质量不好,服务不好,还是其他原因。分析好了后,在即席查询中将所有条件列出,查询出具体的情况,公司相关部门负责人去处理,解决好具体环节。这才是数据仓库解决实际具体情况的深入应用,不仅仅是给老总决策参考,而是给老总及部门负责人具体的,详细的信息,指导如何去处理。 (六)银行DW 在与各方面的交流中,发现目前存在四种对“数据仓库”的理解: 1、按照INMON的定义,数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,这是目前一种主流的理解,毕竟INMON是DW之父,跟着主流错了也没关系。 2、一些人认为,将若干数据集市集合在一起,就可以称为数据仓库。因为这也基本符合上面INMON的数据仓库的字面定义。 3、一些客户(甲方)认为,数据仓库只是一种概念,凡是完整、一致的企业级数据集合,都可以称为数据仓库。 4、从技术角度来说,对于数据

文档评论(0)

ktj823 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档