- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
1.前言
数据仓库中的数据是从许多业务处理系统中抽取、转换
而来,对于这样一个复杂的企业数据环境,如何以安全、
高效的方式来对它们进行管理和访问就变得尤为重
要。解决这一问题的关键是对元数据进行科学有效的管
理。元数据是关于数据、操纵数据的进程和应用程序的
结构和意义的描述信息,其主要目标是提供数据资源的
全面指南。元数据不仅定义了数据仓库中数据的模式、
来源以及抽取和转换规则等,而且整个数据仓库系统的
运行都是基于元数据的,是元数据把数据仓库系统中的
各个松散的组件联系起来,组成了一个有机的整体。
2.元数据
2.1元数据的概念
按照传统的定义,元数据(Metadata)是关于数据的数
据。在数据仓库系统中,元数据可以帮助数据仓库管理
员和数据仓库的开发人员非常方便地找到他们所关心
的数据;元数据是描述数据仓库内数据的结构和建立方
法的数据,可将其按用途的不同分为两类:技术元数据
(TechnicalMetadata)和业务元数据(Business
Metadata)。
技术元数据是存储关于数据仓库系统技术细节的数据,
是用于开发和管理数据仓库使用的数据。
业务元数据从业务角度描述了数据仓库中的数据,它提
供了介于使用者和实际系统之间的语义层,使得不懂计
算机技术的业务人员也能够“读懂”数据仓库中的数
据。业务元数据主要包括以下信息:使用者的业务术语
所表达的数据模型、对象名和属性名;访问数据的原则
和数据的来源;系统所提供的分析方法以及公式和报表
的信息。
2.2元数据的作用
在数据仓库系统中,元数据机制主要支持以下五类系统
管理功能:(1)描述哪些数据在数据仓库中;(2)定
义要进入数据仓库中的数据和从数据仓库中产生的数
据;(3)记录根据业务事件发生而随之进行的数据抽
取工作时间安排;(4)记录并检测系统数据一致性的
要求和执行情况;(5)衡量数据质量。
与其说数据仓库是软件开发项目,还不如说是系统集成
项目[1],因为它的主要工作是把所需的数据仓库工具集
成在一起,完成数据的抽取、转换和加载,OLAP分析
和数据挖掘等。
3.数据仓库元数据管理现状
元数据管理的主要任务有两个方面:一是负责存储和维
护元数据库中的元数据;二是负责数据仓库建模工具、
数据获取工具、前端工具等之间的消息传递,协调各模
块和工具之间的工作。
元数据几乎可以被称为是数据仓库乃至商业智能(BI)
系统的“灵魂”,正是由于元数据在整个数据仓库生命周
期中有着重要的地位,各个厂商的数据仓库解决方案
都提到了关于对元数据的管理。但遗憾的是对于元数据
的管理,各个解决方案都没有明确提出一个完整的管理
模式;它们提供的仅仅是对特定的局部元数据的管理。
与元数据相关的数据仓库工具大致可分为四类:
1.数据抽取工具:把业务系统中的数据抽取、转换、
集成到数据仓库中,如Ardent的DataStage、CA(原
Platinum)的DecisionBase和ETI的Extract等。这些
工具仅提供了技术元数据,几乎没有提供对业务元数据
的支持。
2.前端展现工具:包括OLAP分析、报表和商业智能
工具等,如MicroStrategy的DSSAgent、Cognos的
PowerPlay、BusinessObjects的BO,以及Brio等。它
们通过把关系表映射成与业务相关的事实表和维表来
支持多维业务视图,进而对数据仓库中的数据进行多维
分析。这些工具都提供了业务元数据与技术元数据相
对应的语义层。
3.建模工具:为非技术人员准备的业务建模工具,这
些工具可以提供更高层的与特定业务相关的语义。如
CA的ERwin、Sysbase的PowerDesigner以及Rational
的Rose等。
4.元数据存储工具:元数据通常存储在专用的数据库
中,该数据库就如同一个“黑盒子”,外部无法知道这些
工具所用到和产生的元数据是如何存储的。还有一类被
称为元数据知识库(MetadataRepository)的工具,它
们独立于其它工具,为元数据提供一个集中的存储空
间。包括微软的Repository,CA的Repository,Ardent
的MetaStage和S
您可能关注的文档
最近下载
- 一种检测磷酸铁锂粉末中磁性金属异物及磷化铁含量的方法.pdf VIP
- 2023年华为公司招聘职位要求.pdf
- 三年级心理健康第1-16课全册教案.pdf
- 2021面瘫的针灸治疗测试题【附答案】.doc
- IATF16949第五版DFMEA管理程序+潜在失效模式及后果分析程序.doc
- 智慧城市大数据平台设计方案.pdf VIP
- 匹兹堡睡眠质量指数(PSQI)表格版-打印保健养生.docx
- 林木林地权属争议处理申请书(样本).pptx
- 手机销售网站的设计与实现.doc VIP
- 河南省图集 12YN6、12YN7、12YN9 热力工程、民用建筑空调与供暖冷热计量设计与安装 DBJT19-07-2012.docx
文档评论(0)