元数据管理_原创精品文档.pdfVIP

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1.前言

数据仓库中的数据是从许多业务处理系统中抽取、转换

而来,对于这样一个复杂的企业数据环境,如何以安全、

高效的方式来对它们进行管理和访问就变得尤为重

要。解决这一问题的关键是对元数据进行科学有效的管

理。元数据是关于数据、操纵数据的进程和应用程序的

结构和意义的描述信息,其主要目标是提供数据资源的

全面指南。元数据不仅定义了数据仓库中数据的模式、

来源以及抽取和转换规则等,而且整个数据仓库系统的

运行都是基于元数据的,是元数据把数据仓库系统中的

各个松散的组件联系起来,组成了一个有机的整体。

2.元数据

2.1元数据的概念

按照传统的定义,元数据(Metadata)是关于数据的数

据。在数据仓库系统中,元数据可以帮助数据仓库管理

员和数据仓库的开发人员非常方便地找到他们所关心

的数据;元数据是描述数据仓库内数据的结构和建立方

法的数据,可将其按用途的不同分为两类:技术元数据

(TechnicalMetadata)和业务元数据(Business

Metadata)。

技术元数据是存储关于数据仓库系统技术细节的数据,

是用于开发和管理数据仓库使用的数据。

业务元数据从业务角度描述了数据仓库中的数据,它提

供了介于使用者和实际系统之间的语义层,使得不懂计

算机技术的业务人员也能够“读懂”数据仓库中的数

据。业务元数据主要包括以下信息:使用者的业务术语

所表达的数据模型、对象名和属性名;访问数据的原则

和数据的来源;系统所提供的分析方法以及公式和报表

的信息。

2.2元数据的作用

在数据仓库系统中,元数据机制主要支持以下五类系统

管理功能:(1)描述哪些数据在数据仓库中;(2)定

义要进入数据仓库中的数据和从数据仓库中产生的数

据;(3)记录根据业务事件发生而随之进行的数据抽

取工作时间安排;(4)记录并检测系统数据一致性的

要求和执行情况;(5)衡量数据质量。

与其说数据仓库是软件开发项目,还不如说是系统集成

项目[1],因为它的主要工作是把所需的数据仓库工具集

成在一起,完成数据的抽取、转换和加载,OLAP分析

和数据挖掘等。

3.数据仓库元数据管理现状

元数据管理的主要任务有两个方面:一是负责存储和维

护元数据库中的元数据;二是负责数据仓库建模工具、

数据获取工具、前端工具等之间的消息传递,协调各模

块和工具之间的工作。

元数据几乎可以被称为是数据仓库乃至商业智能(BI)

系统的“灵魂”,正是由于元数据在整个数据仓库生命周

期中有着重要的地位,各个厂商的数据仓库解决方案

都提到了关于对元数据的管理。但遗憾的是对于元数据

的管理,各个解决方案都没有明确提出一个完整的管理

模式;它们提供的仅仅是对特定的局部元数据的管理。

与元数据相关的数据仓库工具大致可分为四类:

1.数据抽取工具:把业务系统中的数据抽取、转换、

集成到数据仓库中,如Ardent的DataStage、CA(原

Platinum)的DecisionBase和ETI的Extract等。这些

工具仅提供了技术元数据,几乎没有提供对业务元数据

的支持。

2.前端展现工具:包括OLAP分析、报表和商业智能

工具等,如MicroStrategy的DSSAgent、Cognos的

PowerPlay、BusinessObjects的BO,以及Brio等。它

们通过把关系表映射成与业务相关的事实表和维表来

支持多维业务视图,进而对数据仓库中的数据进行多维

分析。这些工具都提供了业务元数据与技术元数据相

对应的语义层。

3.建模工具:为非技术人员准备的业务建模工具,这

些工具可以提供更高层的与特定业务相关的语义。如

CA的ERwin、Sysbase的PowerDesigner以及Rational

的Rose等。

4.元数据存储工具:元数据通常存储在专用的数据库

中,该数据库就如同一个“黑盒子”,外部无法知道这些

工具所用到和产生的元数据是如何存储的。还有一类被

称为元数据知识库(MetadataRepository)的工具,它

们独立于其它工具,为元数据提供一个集中的存储空

间。包括微软的Repository,CA的Repository,Ardent

的MetaStage和S

文档评论(0)

135****1503 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档