数据仓库技术在公司管理中的应用.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库技术在公司管理中的应用

数据仓库技术在公司管理中的应用  (呼伦贝尔学院计算机科学与技术学院,内蒙古呼伦贝尔021008)  摘要:文章介绍了数据仓库的定义及特征、数据仓库的体系结构、数据仓库在公司管理中的应用。关键词:数据仓库;公司管理;数据集合  中图分类号:TP311.13文献标识码:A文章编号:1007—6921(XX)24—0110—01  随着计算机科学技术的发展,越来越多的公司逐渐建立了各种各样的应用子系统,如销售系统、库存系统、财务系统、人事系统,经营分析系统,决策支持系统等等。它们能够较好地满足公司OLTP(OnlineTransactionProcessing,联机事务处理)的应用需求。但是,当前绝大多数公司内数据的真正状况是分散而非集成的,数据不一致问题、外部数据和非结构化数据问题都难以解决。  市场竞争的日益激烈,公司需要利用现有的数据,进行分析和推理,为公司的决策提供依据。当这种分析处理只涉及到很少的数据库表时是可行的。当数据量迅速地增长而且查询要求不断复杂化时,这种建立在OLTP基础上的DSS就不能很好地满足决策的需求。另外从大量的历史数据中获取信息,要求系统保存大量的历史数据。如果系统在进行事务处理时还要进行复杂的分析处理,这样对于频繁操作处理的数据库系统而言,将会不堪重负。因此,需要重新组织数据,使其使于进行复杂分析。为适应这一需求,应运而生的就是数据仓库技术。1数据仓库的定义及特征1.1数据仓库的发展  数据仓库,简称DW,其概念起源于20世纪80年代中期,在90年代,数据仓库技术已经成为一大热点。遍及世界的公司都在试图利用多年来存储在他们计算机内的信息。数据仓库的概念是经过被誉为“数据仓库之父”W.H.Inmon加以定义与发展的。1.2数据仓库的定义  数据仓库概念创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用以支持经营管理中的决策制定过程、数据仓库中的数据面向主题,与传统数据库面向应用相对应。1.3数据仓库的特征  ①面向主题数据仓库是一个面向主题的、集成的、非易失的且随时间变化的数据集合,用来支持管理人员的决策。②数据集成性数据在进入数据仓库前,必须经过数据加工和集成。首先要统一原始数据中的矛盾之处,还要将原始数据结构做一个从面向应用到面向主题的大转变。③数据的稳定性操作型数据正规地是一次访问和处理一个记录。可以对操作型环境中的数据进行更新。但数据仓库中的数据呈现出非常不同的特性。数据仓库的数据通常是一起载入与访问的,但在数据仓库环境中并不进行一般意义上的数据更新。④数据随时间变化。数据仓库中的数据随时间的不断变化,主要表现在以下3个方面:会随时间变化不断增加新的数据内容,会随时间变化不断删去旧的数据内容,数据仓库中包含大量的综合数据,这些综合数据很多跟时间有关,会随着时间的变化不断地进行重新综合。2数据仓库的体系结构  由于数据仓库偏重于工程性的特点,因而在技术上可以根据它的工作过程分为:2.1数据的抽取  数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面。在数据抽取方面,未来的技术发展将集中在系统功能集成化方面,以适应数据仓库本身或数据源的变化,使系统更便于管理和维护。数据仓库的数据并不要求与联机事务处理系统保持实时的同步,因此数据抽取可以定时进行,但多个抽取操作执行的时间、相互的顺序、成败对数据仓库中信息的有效性则至关重要。2.2存储和管理  数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据表现形式。数据仓库管理所涉及的数据量比传统事务处理大得多,且随时间的推移而累积。在数据仓库的数据存储和管理中需要解决的是如何管理大量的数据、如何并行处理大量的数据、如何优化查询等。目前,许多数据库厂家提供的技术解决方案是扩展关系型数据库的功能,将普通关系数据库改造成适合担当数据仓库的服务器。2.3数据的表现  在数据表现方面,数理统计的算法和功能已经普遍集成到联机分析产品之中,同时又与Internet/Web技术紧密结合,推出适用于Intranet、终端免维护的数据仓库访问前端。在这个方面,按行业应用特征细化的数据仓库用户前端软件将成为产品作为数据仓库解决方案的一部分。数据仓库实现过程的方法论将更加普及,将成为数据库设计的一个明确分支,成为管理信息系统设计的重要组成部分。3数据仓库技术在公司管理中的应用3.1数据仓库的设计  数据仓库的设计不能照搬传统的生命周期法,而采用类似于快速

文档评论(0)

a888118a + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档