数据仓库及其相关技术综述 - Read.PDFVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库及其相关技术综述 - Read

( ) 第 1 卷  第 1 期 长江大学学报 自然科学版 Vol1 No1 ( ) 2004 年 3 月 Journal of Yangtze University Natural Science Mar. 2004 数据仓库及其相关技术综述 佘春红 (长江大学计算机科学学院 434020) 摘要  数据仓库是信息领域中迅速兴起的一种技术. 本文介绍了数据仓库的概念 、特征及其体系结构 , 并在此基础上着重阐述了数据仓库相关技术中数据集成和视图维护两个重要研究领域. 关键词  数据仓库 ;数据清理 ;数据转换 ;视图维护 ( ) 中图分类号  TP311. 131  文献标识码  A  文章编号  1009 - 0010 2004 01 - 0023 - 05 随着计算机技术的广泛应用 ,许多商业企业已保存了大量原始数据和各种业务数据 ,这些数据真实反映 了商业企业主体和各种业务环境的经济动态 ,但很难获得有效利用. 这是因为不同类型的数据处理有着不同 的处理特点 ,传统的信息处理方式都是以单一的数据为中心的事物处理 ,不能反映这种差异. 尤其是当以业 务处理为主的联机事物处理应用与以分析处理为主的决策支持系统应用共存于一个数据库系统中时 ,这两 种类型的处理发生明显的冲突 ,数据仓库技术应运而生. 1  数据仓库概念及体系结构 1. 1  数据仓库定义 ( ) W. H. Inmon 在 1991 年提出了“数据仓库”Data Warehouse , DW 的概念 ,其定义是“一个用以更好地支持 [1 ] 企业或组织的决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合. ” 数据仓库 的目标是支持全面 、大量的数据存储 ,并依靠客户端工具实现高层次的决策支持 ,它的建立并不是要取代数 据库 ,而是在一个较全面和完善的信息应用的基础上用于支持高层决策分析. 数据仓库的基本特征有以下四 ( ) 点 : 1 数据仓库中的数据是面向主题进行组织的 ,它与传统数据库面向应用相对应. 主题是一个在较高层次 上将企业信息系统中的数据综合 、归类并进行分析利用的抽象 ,每一个主题对应一个宏观的分析领域. (2) 数 据仓库的主题是集成的. 它是从原有的分散的数据源中抽取来的 ,数据源中的数据进入数据仓库之前 ,要经 过加工与集成 、统一与综合. (3) 数据仓库的数据是相对稳定的. 它反映的是一段相当长的时间内历史数据的 内容 ,而不是联机处理的数据 ,因而数据经集成后少有修改. (4) 数据仓库的数据是随时间不断变化的. 它的 稳定是相对的 ,并不意味着从数据集成输入数据仓库开始到最终被删除的整个数据生成周期中所有的数据 永远不变 ,数据仓库随时间的变化要增加新的数据内容. 1. 2  相关概念 1. 2 . 1  数据集市  数据集市是小型的、面向部门或工作组的数据仓库. 数据集市中的数据来 自数据仓库 ,它 仍具有数据仓库中数据的特点 ,而且它自身还具有建设周期短 、投资小 、见效快的优点. 它的使用可以解决各 部门对数据仓库资源的竞争 ,提高处理速度. 1. 2 . 2  元数据  元数据是关于数据的数据. 它描述的是数据的结构 、内容 、码 、索引等项 ,包括数据仓库潜在 的数据来源信息、数据模型信息、业务数据与仓库数据结构间的映射信息以及数据仓库中信息的使用情况 等. 1. 3  数据仓库体

文档评论(0)

2105194781 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档