第10章元数据管理-穿越数据的迷宫:数据管理执行指南.pdfVIP

  • 217
  • 0
  • 约6.12千字
  • 约 5页
  • 2022-06-24 发布于上海
  • 举报

第10章元数据管理-穿越数据的迷宫:数据管理执行指南.pdf

第10章 元数据管理 在整本书中,我们都提到了元数据的使用和管理。数据管理的原则之一是元数据是管理数据所不可或缺的。换句话说,您需要 数据来管理数据。元数据描述您拥有的数据。而且,如果您不知道拥有什么数据,就无法对其进行管理。元数据管理是一项基 本活动,需要在整个数据生命周期中进行。还需要管理元数据的生命周期。 元数据最常见的定义是“关于数据的数据”,这种说法容易引起误解。不幸的是,对于某些人来说,这是造成混乱而不是澄清的 原因,因为可以将多种信息归类为元数据,并且“数据”和“元数据”之间没有清晰的界线。我们不会描述这条线,而是将描述元 数据的使用方式及其重要性。 要了解元数据在数据管理中的重要作用,请想象一个大型图书馆,其中有成千上万的书籍和杂志,但没有卡片目录。没有卡片 目录,读者甚至可能不知道如何开始寻找特定的书甚至特定的主题。卡片目录不仅提供必要的信息(图书馆拥有的书籍和材料 以及在何处被搁置),还使读者可以使用不同的起点(主题区域,作者或标题)来查找材料。没有目录,很难甚至不可能找到 一本书。没有元数据的组织就像没有卡片目录的图书馆。 像其他数据一样,元数据也需要管理。随着组织收集和存储数据的能力的增强,元数据在数据管理中的作用越来越重要。但是 元数据管理本身并不是目的。这是组织可以从其数据中获得更多价值的一种手段。要以数据驱动,组织必须以元数据驱动。 元数据及其好处 在数据管理中,元数据包括有关技术和业务流程,数据规则和约束以及逻辑和物理数据结构的信息。它描述了数据本身(例 如,数据库,数据元素,数据模型),数据表示的概念(例如,业务流程,应用程序系统,软件代码,技术基础结构)以及数 据和概念之间的连接(关系)。元数据可帮助组织了解其数据,系统和工作流程。它可以进行数据质量评估,并且是数据库和 其他应用程序管理的组成部分。它有助于处理,维护,集成,保护,审核和管理其他数据。 没有元数据就无法管理数据。另外,必须管理元数据本身。可靠,管理良好的元数据有助于: 通过提供上下文,实现相同概念的一致表示并实现数据质量的度量来增强对数据的信心 通过实现多种用途来增加战略信息(例如主数据)的价值 通过识别冗余数据和流程来提高运营效率 防止使用过时或不正确的数据 保护敏感信息 减少面向数据的研究时间 改善数据使用者与IT专业人员之间的沟通 创建准确的影响分析,从而降低项目失败的风险 通过减少系统开发生命周期时间来缩短产品上市时间 通过全面记录数据上下文,历史记录和来源,降低培训成本并降低人员流动的影响 支持合规 如果组织的数据质量高,则组织可以从其数据资产中获得更多价值。质量数据取决于治理。因为元数据解释了使组织能够运行 的数据和流程,所以元数据对于数据治理至关重要。如果元数据是组织中数据的指南,则必须对其进行良好的管理。元数据管 理不善会导致: 冗余数据和数据管理流程 复制和冗余字典,存储库和其他元数据存储 数据元素的定义不一致以及与数据滥用相关的风险 竞争和冲突的元数据的源和版本降低了数据使用者的信心 怀疑元数据和数据的可靠性 执行良好的元数据管理可以使人们对数据资源保持一致的理解,并实现更有效的跨组织开发。 元数据类型 元数据通常分为三类:业务,技术或运营。 业务元数据主要关注数据的内容和条件,还包括与数据治理有关的详细信息。业务元数据包括概念,主题领域,实体和属性的 非技术名称和定义;属性数据类型和其他属性属性;范围说明;计算;算法和业务规则;有效的域值及其定义。业务元数据的 示例包括: 数据模型,数据集,表和列的定义和描述 业务规则,数据质量规则以及转换规则,计算和派生 数据来源和数据沿袭 数据标准和约束 数据的安全/隐私级别 数据已知问题 数据使用说明 技术元数据提供有关数据技术细节,存储数据的系统以及在系统内部和系统之间移动数据的过程的信息。技术元数据的示例包 括: 物理数据库表和列的名称和属性 数据访问权限,组,角色 数据CRUD (创建,替换,更新和删除)规则 ETL职位详情 数据沿袭文档,包括上游和下游变更影响信息 内容更新周期作业时间表和依存关系 操作元数据描述了数据处理和访问的详细信息。例如: 批处理程序的作业执行日志 审核,余额,控制度量和错误日志的结果 报告和查询访问方式,频率和执行时间 补丁和版本维护计划和执行,当前补丁级别 备份,保留,创建日期,灾难恢复规定 这些类

文档评论(0)

1亿VIP精品文档

相关文档