- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据模式描述规则和方法标准培训教材
科学数据共享通用标准培训系列教材
《数据模式描述规则和方法》
标准培训教材
科学数据共享工程办公室
2006 年2 月
录
一、 编制背景 - 1 -
(一) 科学数据资源现状 - 1 -
(二) 面临资源整理需求 - 1 -
(三) 解决此类问题的惯例 - 2 -
二、 编制思路 - 3 -
(一) 本标准的基本原则 - 3 -
(二) 本标准的工作思路 - 4 -
(三) 本标准的适用范围 - 5 -
( 四) 本标准与其他标准关系 - 5 -
三、 标准总体结构 - 6 -
四、 标准内容要点解析 - 7 -
(一) 数据模式概述 - 7 -
(二) 数据模式描述规则 - 10 -
(三) 数据模式建立与描述方法 - 15 -
五、 标准使用 - 15 -
(一) 前期工作基础 - 16 -
(二) 正式工作阶段 - 18 -
学数据共享通用标准培训教材
《数据模式描述规则和方法》
标准培训教材
一、编制背景
( )科学数据资源现状
科学数据资源是指,科技活动或其它方式获取到的原始基本数据,以及根据
科技活动需要进行加工整理后的 类数据集。
科学数据共享工程中存在大量科学数据资源,科学数据共享的核心是科学数
据资源。科学数据资源具有两个的显著特点:一是共享科学数据数据的来源非常
广泛。例如各个领域的业务信息系统所产生的数据、科学研究活动中积累的数据、
以及在基础数据基础上加工衍生出来的各种数据资源等。二是数据的存储形态
异。例如文档,文本,数据库,图像,音频,视频文件等。
(二) 面临资源整理需求
科学数据共享工程中,不同来源、不同格式的科学数据资源,将以主体数据
库形式进行建设,以数据集形式进行共享和交换,提供给需要科学数据共享数据
集的用户。
数据建模对于共享数据库的建设非常重要。从建设的角度看,各单位是在明
确了共享数据集内容含义和组成结构的基础上,确定相应的共享数据建库方案,
从业务数据库等信息源中提取、 换、加工形成共享数据集,多单位联合建立共
享数据集的时该工作尤其重要。从使用的角度看,用户需要了解数据内容及其组
成结构后,才能够有效使用。
数据模式是数据的概念、组成、结构和相互关系的总称,因此可以先建立共
享数据集的数据模式标准,再将共享数据集提供给用户。建立的数据模式不但可
以保障对于共享数据集准确、无歧义的理解,而且还提供了进一步加工、处理和
应用共享数据集的必要基础。
- 1 -
学数据共享通用标准培训教材
实现 学数据资源共享的前提条件是对共享数据集内容和结构信息进行规
范化描述,形成共享数据集的数据模式标准。我们通过数据模式描述规则和方法
标准来提供一整套规范化的数据模式描述规则与科学的建立方法。
(三) 解决此类问题的惯例
在数据模式规范化表述方面,国内外普遍采用的主流方法包括:
n 实体关系(Entity-Relation )模型描述
E-R 模型是由P.P.S.Chen 1976 年提出,用E-R 图来抽象表示现实世界的数据
特征,是一种语义表达能力强易于理解的概念数据模型。E-R 模型图是用图解的
方法描述实体、联系及其相关属性。目前,E-R 模型图已经是比较成熟的应用在
关系型数据库前期信息建模过程中。
实体是任何可以明确的人、地方、事件、概念、事物。例如:地震台站、某
天的天气情况。关系是实体与实体之间的联系。
n 统 建模语言(Unified Modeling Language
文档评论(0)