浅论空间数据仓库.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅论空间数据仓库 陈书琳1 方兆宝1·2 1,中国矿业大学(北京校区)2,海军91561部队 1.引言 所需要的数据只是与一些维数(每一维代表对数据的一个特定的观察视角,如海区、时间)和不 同级别(如部门、领域)统计或计算有关。此外。随着政府及商业应用的发展。数据量急剧增加, 用户的需求也越来越复杂,不仅要能查询或操作数据,还要进行数据分析和信息综合,可以说, 以多维数据为核心的多维数据分析是决策的主要内容。于是,人们开始尝试对数据库中的原始 数据进行重新组织,再加工和再利用,将旱期数据库为人们提供的以数据查询为主要目的的应 用方式,逐步形成一个综合的、面向分析的环境,最终为管理层提供决策的分析依据。由此,数 据仓库(DW)的思想逐渐形成。可以说,数据仓库是由数据库发展而来的,与传统的数据库目 标又有较大的不同。 2.数据仓库 2.1数据仓库的概念 数据仓库并不是一个新的平台(它仍然建立在数据库管理系统基础之上),而是一个新的概 念。 公认的数据仓库之父w.H.Inmon给数据仓库下的定义是:数据仓库是集成的、面向主题 的、用于决策支持的数据库集合,其中每个数据单元都与时间相关。 “面向主题”的数据仓库要求进行数据库设计,而一些数据库设计者忽略了这一重要环节, 根本没有进行正规的数据库设计。他们简单地把原有数据库或者并非专为数据仓库设计的现 有决策支持系统(DSS)中的数据复制到数据仓库中。这样建立的不是良构的、可独立维护的主 题数据库。 “数据集成性”意味着要用一些设计方法来建立数据仓库的数据库。在命名协议、关键字、 关系、编码和翻译中的一致性问题只能通过精心的设计取得。 “与时间相关”意味着数据仓库中的数据人都与时间相关。因此数据仓库中的数据组织方 式要便于按时问段计算和提取数据。 “相对稳定”是指数据仓库中的数据不进行实时更新。通常数据是以每夜、每周或每月为周 期进行升级,这一升级的过程不是简单的拷贝.而是要经过复杂的提取、概括、聚集利过滤等操 作过程。数据一旦进入数据仓库,就不允许随便更新了。 2.2数据仓库的内涵 (1)数据仓库应支持多种数据源,不仅仅是数据库,还应有各种数据文件、文本文件、应用 程序等。 (2)数据仓库中存放的应该不仅是供分析使用的数据。还应有在一定激发条件下能主动起 作用的处理规则、算法、甚至是过程。 (3)传统的物理数据仓库方法并非唯一的选择,应根据需求的具体情况,建立虚拟数据仓 库的解决方案。 (4)数据仓库中的数据并不完全是原始数据的简单归并和搬家,而应该是增值利统一。因 此“汇总并统一”是数据仓库的必须内涵描述。 373 2 3数据仓库技术的现状 2.3.1数据仓库处理 数据仓库和数据库的不同在于:数据库是一种通用的平台,用来管理企业的数据;而数据仓 库则主要是一种概念,在此概念下进行的构造过程,称为数据仓库处理。所以说,数据仓库不是 可以直接购买到的现成产品.除了需要购买必要的工具以外,数据仓库主要是一个建立的过程。 数据仓库处理主要包括三方面的内容:数据准备、数据展现和过程管理。 数据准备包括:充分了解决策需求;按数据仓库方法设计数据库结构;业务系统数据向数据 仓库结构转移(包括提取、概括、聚集和过滤等)。数据仓库数据向小规模数据集市(DataMart) 数据复制。 数据展现包括:面向高层决策者的主管信息系统(EIS):面向决策分析者的联机分析 Hoe (OLAP)系统:为各层决策者服务的即席查诲(Ad Query)系统;为报表制作人员服务的报表 生成(Reporting)系统。 另外,数据仓库的建立需要很好的过程管理和方法。 2.3.2数据仓库需要独立的环境 或许未来的数据仓库能够把事务处理利决策支持合二为一,但日前还必须为数据仓库建立 独立的环境。 首先,现有软、硬件性能的局限性使得一个环境难以同时支持El常业务处理和决策支持目 标。 其次,数据仓库常用于分析长期趋

文档评论(0)

zaqxsw1230 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档