数据元为中心数据标准体系研究-袁满.pptVIP

数据元为中心数据标准体系研究-袁满.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
对数据元素(元数据)注册实现电子化、规范化管理,为数据元素(元数据)实现全生命周期的管理, 从它的创建、使用、维护一直到它的废弃。 对数据元素(元数据)注册功能 数据质量管理的一种通用方法是戴明质量环,戴明 (Deming, W, Edwards)是对质量管理的发展产生巨大影响的大师之一,他提出了被大家所知的”计划-实施-监控-行动”或“计划-实施-检查-行动”用于解决问题的模型,该模型对数据质量管理同样有效。按着戴明模型,把数据质量管理划归为以下4个部分: 计划阶段:数据质量团队评估已知的数据问题同,包括确定问题的代价和影响以及对评估处理该问题的可选方案。 实施阶段:剖析数据并执行检查与监督,识别出现的数据质量问题。在些阶段,数据质量团队可以修复引致数据错误的流程中存在的缺陷,或者作为一种应急办法对下游错误进行校正。如果不能的错误的源头校正,那么就在数据流中尽早校正该错误。 监控阶段:根据已定义的业务规则对数据质量水平进行动态监控,只要数据质量满足可接受度阈值,流程就是受控的。 执行阶段:主要是处理并解决出现的数据质量问题。    数据采集无论是采用手工采集,还是仪器采集,其质量控制是其中的一项重要任务。因此,对于不同源头产生的数据,对数据的采集必须制订相应用采集规范,其中在数据质量维度在其中起到了重要的作用。 DQ 准确性维(Accuracy) 完整性维(Completeness) 一致性维(Consistency) 时效维(Currency) 精确度维(Precision) 隐私维(Privacy) 合理性维(Reasonableness) 参照完整性维(Referential Integrity) 及时性维(Timeliness) 唯一性维(Uniqueness) 有效性维(Validity)    因此,按着DAMA标准,对于数据质量的评估及控制以及质量评估与控制标准的制订均离不开这11个维度.对于有些数据集要能只关注其中的几个重要维度. 数据操作管理-指导原则 需要对数据质量制订的规范或标准应该包括如下: 质量业务规则规范 质量控制规范 质量评估规范 该模型是面向对象 模型的灵魂,是对业 务活动的高度抽象, 人类的任何活动均可 用这一三角模型描述。 对象与对象间的相互作用产生了活动(即业务活动)。 特性—在具体应用中是对“对象属性”及其“对象活动”(即对象行为)的记录;以活动为中心,在活动中既可能创造出新的对象,同时也可能会随之就产生出新的特性。 活动 特性参数分析 对象(O) 孔隙度 饱和度 渗透率 度量单位 % d/md … 基 质 孔 隙 度 总 孔 隙 度 有 效 孔 隙 度 … 含 油 饱 和 度 含 气 饱 和 度 含 水 饱 和 度 … 绝 对  渗  透 率 水 平 渗 透 率 垂 直 渗 透 率 裂 缝 渗 透 率 残 余 油 饱 和 度 初 始 含 油 饱 和 度 圈 闭 含 油 饱 和 度 … O A P 地层/岩心 特性(P) /数据元 其中的对象可能是油层、岩心等对象 树的左半部分分支牵着对象的组织->数据模型中的实体; 树的右半部分牵着对象的特性->是所有对象实体的特性树 本体(Ontology)的定义:  本体就是由若干概念及其在某种逻辑理论(如一阶谓词演算)支持下的定义所构成的一种分类法。 Tom Gruber给本体的定义是一种对于某种概念体系(概念表达、概念化、概念化体系或者说概念化过程)的明确而又详细的说明。 对于特定一个领域而言,本体表达的是其那套术语、实体、对象、类、属性及其之间的关系,提供的是形式化的定义和公理,用来约束对于这些术语的解释。本体允许使用一系列丰富的结构关系和非结构关系,如泛化、继承、聚合和实例化,并且可以为软件应用程序提供精确的领域模型。    而数据元素分析与构建过程中形成的UDEF正是企业的一套术语、实体、对象、类、属性及其之间的关系。由此可以见数据元目录为本体构建提供了标准的术语表,即全局本体。 主讲人:袁满(教授) 东 北 石 油 大 学 (Yuanman@) 三个世界的定义 数据与元数据 什么是标准化和数据标准化 数据元素方法论 数据体系与数据标准体系 体系架构中各个标准维度功能 自标准数据技术架构 数据元在数据交换中应用的案例 总 结   三者之间交互的核心是各种各样的概念(术语)以及它们之间的关系。人类希望将现实世界中所做的一些事情让计算机模拟人类来完成,因此,人类认识世界的这些概念映射到计算机世界中去,让计算机模拟人类的活动。由于人类认识世界的角度的不同,可能对同一类事物认识的结果也不同,所以,要实现计算机化的活动就必须让人类对这些概念的认识达成一致才行。现实世界中存在冲突的事物,必须在概念世界中

您可能关注的文档

文档评论(0)

celkhn5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档