2014元数据管理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
参考文献:Adaptive and Scalable Metadata Management to Support A Trillion File ? ? ? 引言: ? ????????? MDS维持文件系统的名字空间和文件属性,存储服务器处理读写操作。它可以提供很高的I/O。 但是随着因特网的普及,高端科学计算的应用增加,集群文件系统也面临了三个问题: 1、怎么样有效的组织和管理好极大的目录,每个目录中包含了数十亿个文件 2、在一个包含了数十亿或百万兆个文件的大文件系统中,如何提供高性能的元数据管理 3、大量用户并发工作,产生混合的工作负载时,如何提供高的元数据管理性能 ? ? 什么是元数据metadata ? ?????? 元数据最本质、最抽象的定义为:data about data (关于数据的数据)。它用于描述要素、数据集或数据集系列的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等有关的信息。 ????????元数据以非特定语言的方式描述在代码中定义的每一类型和成员。元数据存储以下信息:??   程序集的说明。   标识(名称、版本、区域性、公钥)。   导出的类型。   该程序集所依赖的其他程序集。   运行所需的安全权限。   类型的说明。   名称、可见性、基类和实现的接口。   成员(方法、字段、属性、事件、嵌套的类型)。   属性。   修饰类型和成员的其他说明性元素。 ? 元数据的应用 ? ?????(1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。   (2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。   (3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。   (4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转换方式(Migration Methods)、保存责任等内容。 ? 元数据结构 ?   总体结构定义方式 一个Metadata格式由多层次的结构予以定义:   (1)内容结构(Content Structure),对该Metadata的构成元素及其定义标准进行描述。   (2)句法结构(Syntax Structure),定义Metadata结构以及如何描述这种结构。   (3)语义结构(Semantic Structure),定义Metadata元素的具体描述方法。    ?????? 内容结构   内容结构定义Metadata的构成元素,可包括: 描述性元素、技术性元素、管理性元素、结构性元素(例如与编码语言、Namespace、数据单元等的链接)。   这些数据元素很可能依据一定标准来选取,因此元数据内容结构中需要对此进行说明,例如MARC记录所依据的ISBD,EAD所参照的ISAD(G),ICPSR所依据的ICPSR Data Preparation Manual。  ?? ?句法结构   句法结构定义格式结构及其描述方式,例如元素的分区分段组织、元素选取使用规则、元素描述方法(例如Dublin Core采用ISO/IEC 11179标准)、元素结构描述方法(例如MARC记录结构、SGML结构、XML结构)、结构语句描述语言(例如EBNF Notation)等。   有时,句法结构需要指出元数据是否与所描述的数据对象捆绑在一起、或作为单独数据存在但以一定形式与数据对象链接,还可能描述与定义标准、DTD结构和Namespace等的链接方式。   语义结构 ?????? 语义结构定义元素的具体描述方法,例如 描述元素时所采用的标准、最佳实践(Best Practices)或自定义的描述要求(Instructions)。 ? ? ? ? 1、No parti

文档评论(0)

dlyaEkIaza + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档