- 1、本文档共30页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
科学数据库元数据分析与应用 中国科学院计算机网络信息中心 黎建辉 2004.6.3 提纲 科学数据库元数据建设的背景与需求 科学数据库元数据框架 科学数据库核心元数据规范 工具与试应用 总结 背景 从学科视角看科学数据库(Domain) 45个主体数据库主要涉及到8个的一级学科 生物学(14) 地球科学(19) 物理学(3) 化学(3) 天文学(1) 材料科学(2) 能源科学技术(2) 化学工程(1) 背景(Cont.) 从资源分布的视角看科学数据库(Distribution) 45个主体数据库主要分布在15个城市,涉及到45个单位 北京(17) 上海(3) 沈阳(1) 长春(4) 大连(1) 兰州(1) 西安(1) 新疆(1) 成都(1) 昆明(2) 武汉(4) 长沙(1) 南京(3) 青岛(1) 广州(4) 背景(Cont.) 从资源类型的视角看科学数据库(Data type) 结构化数据(Structure Data) 关系数据库 半结构化数据(Semi-structure Data) Html 特定类型的数据文件 非结构化数据(Un-structure Data) 图像、视频、音频等多媒体文件 背景(Cont.) 自治性带来异构性 元数据的需求(Cont.) 从数据访问和共享的需求看 元数据的需求(Cont.) 从数据库集成与互操作来看 元数据的需求(Cont.) 从数据库集成与互操作来看 科学数据库中二个层面的元数据 元数据在科学数据库中的作用 科学数据库元数据框架 规则集 语义规则(Element Semantic) 中文名称(Chinese Name) 英文名称(English Name) 标识(Identifier) 定义(Definition) 类型(Type) 值域(Domain) 选择性(Option) 最大出现频率(Max Occurrence) 注释(Note) 规则集 规则集 语法规则 遵循 XML Schema 语法规则 语法规则 扩展规则 应用方案制定(Application Profile) 应用方案制订规则 裁减 应该包括原标准中的所有必选模块的必选元素; 一般来说,所创建的元数据应用方案中应包含原标准中的核心元数据元素; 允许根据需要削减掉某些可选元素; 扩展 在确定拟新增模块/元素与原标准中的模块/元素不存在语义重复之后,可以定义新的模块/元素; 新增元素不可用于替换原标准中现有元素的名称、定义或数据类型。 应将扩展元素合理地组织到原标准所确定的“模块-复合元素-数据元素”这一结构中去; 应用方案制订规则 修改 允许对已有模块/元素施以更严格的可选性限制,即可以在应用方案中将核心标准中的某一可选模块/元素设定为必选元素。 允许将已有元素的值域由“自由文本”替换为一个合适的值代码表,以限制该元素的值域; 允许缩小已有元素的值域。例如,在核心标准中某个已有元素的值域为整数,那么应用方案中可以规定该元素的值域为某个范围内的整数; 允许对已有代码表进行扩充; 不允许对核心标准进行上述原则所没有允许的任何扩展。 基于框架的实施现状 科学数据库核心元数据规范 适用对象 任何一个数据库/数据集,包括逻辑意义上的以及物理意义上的 作用 各专业数据库提供统一、规范的结构化描述 为各专业子库的导航、联合目录服务 为网格平台中信息服务子系统、数据访问子系统服务 设计的原则与优点 简单性与通用性 可扩展性 缺点 各学科领域的专指度不够 核心元数据规范(Cont.) 核心规范的学科领域应用范例 生态数据元数据规范 两种规范之间的关系 工具支持与试应用 总结 元数据对科学数据库的资源发现、管理、应用和互操作至关重要 科学数据库中元数据包括数据库描述和数据库内容两个层面的元数据,后者在分析和应用过程中难度更大,对数据库的互操作和集成作用也更大 一个定义完整的元数据框架对于一个多种元数据格式并存的系统尤其重要,它是未来系统中不同的元数据互操作的基本保障 谢谢! * Distribution(Autonomous) Domain Data Type C(DB)= {Distribution, Domain, Data type} Design Autonomy The conceptualization or semantic interpretation of data The representation and the naming of the data elements The data being managed Constraints used to manage the data The functionality of the system The ass
文档评论(0)