浅析数据仓库技术在现代企业中应用.docVIP

浅析数据仓库技术在现代企业中应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析数据仓库技术在现代企业中应用   [摘 要]在信息高速发展的今天,企业的经营决策要依赖充足的信息资源,而作为信息载体的数据分散在经营管理的各个层面。企业为了获取经营管理的数据,一般都会建立自己的数据仓库系统,在数据仓库的基础上实施管理信息系统。为增强数据定义和使用的一致性,促进系统集成,充分实现信息资源共享,统一数据标准就成为现代企业迫在眉睫的工作。   [关键词]数据仓库;技术;应用   中图分类号:F2 文献标识码:A 文章编号:1009-914X(2014)47-0238-02   一、基本概念   “数据仓库”这个词首次是由号称“数据仓库之父”的William H?Inmon提出的。他在《构建数据仓库》一书中指出,“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持经营管理中的决策制定过程。”随着人们对数据系统研究管理和维护的不但深入,对数据仓库有如下几个特点达成了共识:数据仓库中的数据是面向主题的、集成的、不可更新的、随时间增加的,建立数据仓库的目的是为了更好地支持决策分析。   二、数据仓库的构成   1、数据源   数据源是数据仓库系统的基础,是整个系统的数据源泉,数据源是数据仓库可以利用的各种数据包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等。   2、数据的存储与管理   数据的存储与管理是整个数据仓库系统的核心。数据仓库管理主要包括根据需求建立数据模型和日常维护工作。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库。   3、分析工具   分析工具用来完成实际决策所需的各种查询检索工具,报表生成工具,OLAP(联机分析处N)I 具和数据挖掘(DataMining) 工具等。OLAP服务器主要是对需要分析的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。具体可分为ROLAP(关系型在线分析处理)、MOLAP(多维在线分析处理)和HOLAP(混合型线上分析处理)。ROLAP基本数据和聚合数据均存放在RDBMS之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP基本数据存放于RDBMS之中,聚合数据存放于多维数据库中。   三、 数据仓库的特征   1、主题性   主题是一个抽象的概念,一般来讲,应该是指企业决策层所关心的较宏观分析对象,根据这一主题要求对相关数据进行综合、归类。与其相对的,是面向应用的数据组织方式,也就是说,这种对分析对象数据的描述,是按照主题进行数据组织的,具有更高的数据抽象级别。   2、集成性   集成性首先意味着源数据分散存在于原有数据库中不同的地方,而且来源于不同系统的数据都有各自不同的应用逻辑。其次,是指数据在进入数据仓库前要经过统一整理,这一过程是一个复杂的处理过程,要遵从于统一的主题要求。综合地讲,数据仓库的集成性就是指运用数据仓库技术,将不能从原有数据库系统直接得到的数据从中抽取出来,经过一定程式的处理进入数据仓库后再根据主题要求进行综合。   3、可变性   数据仓库不是―个静止不变的产品,而是一个动态的过程。这个过程为全企业的管理系统奠定信息基础。该系统可用来测算利润、管理和分析风险、进行市场分析、帮助规划和加强客户服务计划及市场推进计划。与现买现装的产品不同,成功的数据仓库实际上是一个过程。它要求公司仔细分析本公司的基本原则,决定需要哪些运作数据和外部数据源,然后利用一种严密的方法把所有的数据集中起来,再变换成有用的信息。   4、不可更新性   数据仓库的数据的是一定时间下数据的集合,是不同时点的数据汇集。这些数据区别于联机处理的数据。数据仓库的数据一般用来处理企业决策分析,据此数据的主要操作是数据查询。大量的经过加工后的数据经过集成进入到数据仓库中,数据仓库的数据不断累积,但数据仓库管理系统比一般的数据库管理系统反而要简单一些。数据库管理系统由于考虑到数据的各种处理,必须建立各种及相关方法和技术来保证数据处理的正确和高效,如完整性保护、并发控制等等,这些都是在数据仓库中没有必要进行的。另一个方面数据仓库的查询数据量很大,要求数据仓库采用各种复杂的索引技术;而且数据仓库多数是直接面向终端用户的,有的甚至允许终端用户直接调用数据库处理命令进行数据的处理加工,这样数据的操作查询界面必须考虑用户的体验,这一点是数据库系统所不必理会的,因为一般的数据库系统通常直接面对专业的编程技术人员。   四、数据仓库的相关技术   1、异种数据源集成  

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档