数据元与元数据、数据项区别.pdfVIP

  • 178
  • 0
  • 约3.6千字
  • 约 2页
  • 2020-09-07 发布于天津
  • 举报
. 1、数据元与元数据的关系 首先肯定一点是:数据元本身也是数据单元,即也是数据。它就是一个用来对各行业的数据进行自身规范 化的一个方法或一套指导的理论。用这一套方法对行业数据进行统一的名、型、值规范及分类。可以说数据元 是组成数据的最小单元,是基本的。就像化学元素一样,化学元素本身并不多,即几十种,但由这几十种元素 构成的物质可是形形色色。所以对于一个行业来讲数据元应该是有限的,而不是无限的。理解数据元应该从它 的几个性质来认识 : (1)原子性:即说明数据元具有原子特征,即是组成数据最小单元。例如“金额”本身就是一个基本数据元, “产量”,“重量”、“密度”等等 (2 )集成性:按照数据本身自然联系建立数据间的关联关系,体现出了数据的集成性。同时,通过对数据元的 分析,对数据的分类具有重要的指导作用。 (3)演绎性:说明可由基本数据元演绎或派生出许许多多的应用数据元,继上面的实例: 煤产量、原油产量、钢产量等,或更细致地可以演绎出:煤年产量 /煤月产量 /煤季产量 / 煤累计产量等。 从上面的讨论,我们可以看出,实际上数据元由基本数据元与应用数据元之分,所以一般来讲,我们就是指 基本数据元。 可以看出,行业数据元应该是有限的,规划好行业数据元之后,可以为行业构建出统一、集成的、稳定的 数据模型奠定基础, 同时它也为数据交换奠定基础。 更重要的是在逻辑层上为我们提供了一个统的 “参考模型”。 以前存在的一些模型中的数据与其它模型进行共享时,可以在这个逻辑的“参考模型”一层上得到统一。 而元数据,我个人认为理解这个元数据也应有几个层面的问题,首先,从它的定义上讲,所谓的元数据是 “描述数据的数据” 。单从这个定义上来看,元数据的定义是相当宽泛的。例如,描述数据元有二十几个属性, 即这二十几个属性(例如数据元名称、定义、类型等) ,我们就称为是描述数据元的元数据。这只是单纯地从它 的定义上来理解,其实,一般我们所指的元数据,通常都与具体的应用挂钩的。例如,我们保存到 DBMS 中的 表结构、索引、字典、报表格式等等均为元数据,所以可以看出,元数据 (Metadata) 与数据元( Data Element ) 不是一个层面上的概念。 二者的关系:数据元规划好了,可以为企业提供高效的,而非冗余的元数据。元数据与软件及数据仓库紧 密相关。另外,数据元之后才能谈元数据,元数据更接近于应用,而数据元仅仅是从数据名、型、值以及分类 的角度对数据进行规划。数据元设计是为数据集成,即数据模型构建奠定基础,它更面向数据模型,而数据元 更接近实际应用。 2.信息系统基本(通用)数据元怎样划分与提取? (1)按照行业中的关键业务活动, 即工作流程, 从源头出发来初步地提取出数据项, 即业备流中蕴涵着数据流, 这样可以保障所提取的数据元能够满足多学科的应用需求;这个过程也是分专业进行分析的过程。 (2 )将多专业的数据进行统一考虑, 一般来讲, 我国行业信息建设发展到今天数据已经有了很大程度上的积累, 这样为我们提取数据项提供了更方便的条件。这样可以按照数据元的方法对数据元本身进行分类,这种分类一 般有按照“对象” 、“特性”以及“表示”等进行分类,这是最基本的分类。也有的可以按照自行业和特点按照 应用主题或其它进行分类。 相似类别的数据分类到一起,这样可以统一考虑该类数据的名、型及值等问题。数据元的提取是一个逐步 求精的过程,不可能一次就完成,它要有一个反复的过程。 上面所说的按照对象来分类,是指该数据元是描述什么对象的,例如,在石油行业,井号,这个数据元本 身就是描述“井”这个对象的,所以如果按照对象来分类,那么它将被分到“井”这个对象。可以看出,按照 对象来分类时,可以为下一步建模奠定一个好的基础。 按照特性与表示也可以从不同的角度来对这些数据元进行分类。对基本数据元的分析,最后可能会得到一 个层次关系,有的人问,这个基本数据元到底要分解到何时为止呢?回答是:具体抽象为哪一层与行业应用有 关系,这不是死规定。一般来讲,数据元如果越基本,那么它的抽象度应越高,而距离实际应用主题就越远。 这就要根据实际而定

文档评论(0)

1亿VIP精品文档

相关文档