元数据管理的5种成熟度.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
元数据管理的5种成熟度

当企业内外部的数据越来越多时,元数据管理就会成为许多公司的一个关键问题。本文从用户、处理和技术的不同角度,描述企业元数据管理的不同成熟度模型和企业沿着成熟度阶梯向上提升的步骤。 对于什么是元数据,目前存在着许多种不同的描述。本文中的元数据包括技术上的元数据和业务上的元数据。技术上的元数据指数据源的位置、数据访问协议(ODBC、JDBC、SQL*NET等)、数据源的物理结构(如数据库描述、表定义、栏目描述等)、数据源的逻辑结构(ER模型、目标模型、实体模型)等。业务上的元数据指与信息获取有关的上下文信息、定义企业组织机构和产品层级的分类法、用来定义商业术语的控制性词汇的词汇表或参考数据,例如医学词典、金融术语等。 所谓元数据管理,就是对技术元数据和业务元数据进行管理,其目标是为了提升共享、重新获取和理解企业信息资产的水平。不对元数据进行管理或管理不得当,信息将被丢失或处于隐匿状态而难以被用户使用,数据集成将十分昂贵,不能对业务进行有效支撑。终端用户要识别相关的信息将十分困难,最终用户将失去对数据的信任。本文描述了元数据管理的五级成熟度模型。各个公司可以依据本公司人们怎样处理元数据的行为特征,利用它作为指导,决定公司目前所处的级别。 第一级: 随机状态(Ad-hoc) 行为特征 在这一级上,对元数据的管理是随机的。元数据由某个人或某一组人员在局部产生或获取,并在局部使用。在大多数时间里,元数据是隐匿在信息中,比如存储于诸如Word、Excel等形式的办公文档,这些文档使用的术语仅局部的用户能知道其确切含义。人们通过与“责任人”直接通信或通过信息会话来获取这些知识。在局部环境工作数月或数年后,人们使这些元数据以及对它的理解内在化,使对这种信息有习惯性的理解。 在这一阶段,元数据通过组织机构缓慢的传播或根本不传播,这取决于局部小组与其他小组间的通信量的大小,这些元数据可能永远“待”在该局部小组或某个人那儿。如果这样的小组或个人调离,则这种元数据信息可能永远丢失。 人 元数据知识保留在人的大脑中。在这种环境中,知道(或不知道)与谁交谈对于理解元数据成为一件十分重要的事。 处理 元数据要通过与“责任人”的交谈才能共享。新来者需要通过他们的日常工作来学习元数据。外部人员难以理解元数据,他们必须与“责任人”交谈才能得到他们想要的东西。因为元数据在局部产生或抓取并在局部使用,所以通常也只能在局部修改,这种修改通常也不会通知公司里其他的组织。 技术 可以用各种不同的工具来生成元数据。绝大部分是面向个人电脑的应用软件。例如,ERWin可用于数据库建模,Rational用于为对象建模、Excel用于生成商品列表等。这些工具都没有设计成可以交换信息,因此,只能在当地的文件系统中保存所生成的元数据。 第二级: 发现 行为特征 在元数据管理的这一级上,可以发现在不同企业之间的元数据。像第一级的情况一样,元数据仍然在局部产生和抓取,然而,它处于可发现状态,这样的元数据在企业一级显露,使得每一个对它有兴趣的人都能随时了解“什么已经存在”。元数据仍然可以在局部级上维护,然后更新中央知识库,但它们仍然使用不同的命名法。结果,相同的名字被用于表示意义不同的事情,而同一件事情则使用了几个不同的名字。 尽管如此,相比之下,从不同来源来的数据和数据的含义已经具有了更多的透明度。对于商业用户,如果他们需要,现存的技术可为他们提供有关数据的来源和怎样对数据进行计算的信息。 人 人们开始感知到共享元数据信息的重要性。业务分析员、数据拥有者和应用开发者现在自觉地将元数据信息加载到中央知识库中。 处理 元数据知识经由中央数据库进行共享。凭借对中央知识库地理解,人们能够发现在其他应用系统中的数据。然而,由于使用术语的不同,人们互相之间需要交流,以便弄清某些元数据的含义。而且,由于元数据的更新不受任何方式的控制,使得这种更新没有告示或贴切的分析。 技术 有一些元数据管理工具可用于共享来自数据源的元数据,并能把来自不同建模工具的逻辑元数据导入到元数据知识库中。AG Rochade、Unicon、MetaMatrix是该类产品的一些例子。然而,除了以商业含义来定义数据表格的栏目名之外,这些工具没有一个能很好地抓取元数据。 第三级: 管理控制 行为特征 这一级对元数据的修改进行集中管理。局部业务单元或开发小组如不通知其他的元数据保管者和用户,就不再能按照自己的想法对元数据进行修改。在一个地方发起的元数据的修改将传播给其他地方。有各种工具和方法可用于不同业务单元之间交换元数据。为了整合不同数据源中的数据,仍然必须用手工进行数据的映射,以解决不同数据源的数据整合。但是,这种映射在一个中央知识库上进行维护和管理。 人 数据拥有者、应用开发人员、用户和其他的数据保存

文档评论(0)

xy88118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档