- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子文件管理元数据置标语言比较研究
电子文件管理元数据置标语言的比较研究
1.电子文件管理元数据的结构化或半结构化特征
2003年11月28日由国际标准化组织发布的《ISO/PDTS23081-1信息与文献――电子文件管理流程――电子文件元数据》标准在指出电子文件管理元数据的概念时,专门强调了:“元数据管理是电子文件管理过程中必不可少的一部分。”可见电子文件管理元数据在电子文件管理中的地位。
同时,该标准还专门指出了电子文件管理元数据所具有的特征,即:“电子文件管理元数据是结构化或半结构化的信息。”所谓结构化信息一般是指可以自描述并能够完全揭示语义的信息;而所谓的半结构化信息就是指可以自描述但不能完全揭示语义的信息。这里所说的可以自描述的信息是指能够完整表达元数据的元素名称和元素值的信息,能够完全揭示语义的信息是指能够同时从置标标识符和元数据内容两方面揭示语义的信息。电子文件管理元数据是一种结构化或半结构化的信息,这就是说它可以是可自描述并能够完全揭示语义的元数据,也可以是可自描述但不能完全揭示语义的元数据。那么为什么电子文件管理元数据会有结构化或半结构化特征呢?这主要与电子文件元数据所使用的置标语言有关。
目前在国际电子文件管理领域,用于电子文件管理元数据置标的语言主要有三种:超文本置标语言(HTML)、可扩展置标语言(XML)和文本语言(TEXT)。所谓元数据的“置标”,作动词时就是指给元数据加标识符号的意思,作名词时就是指元数据的标识符号。如以电子文件管理元数据的题名元素――元素值为“关于加强感染性‘三废’处置监督管理工作的报告”的置标为例,示意如图1――电子文件管理元数据题名元素的置标:
从图1可以看出,通过标识符号“、”对“关于加强感染性‘三废’处置监督管理工作的报告”这一文件的题名进行置标,清楚地表达了该文件的题名为“关于加强感染性‘三废’处置监督管理工作的报告”这一语义,使题名元数据达到了自描述并完全揭示语义的目的。因此,我们又将其称之为结构化的元数据。由此可知,置标是电子文件管理元数据取得结构化或半结构化特征的关键,没有???标就没有元数据的结构化或半结构化。
2.电子文件管理元数据置标语言的比较研究
2.1超文本置标语言(HTML)置标电子文件管理元数据的特点
超文本置标语言英文全称是HyperText MarkupLanguage(简称HTML)。它是万维网联盟(W3C)为网页设计而制定的一种语言,是标准通用置标语言(简称SGML)的一个子集,它通过规定一种简单的结构和一个标识集合解决了标准通用置标语过于复杂不利广泛使用的问题,且这种应用是着重在如何将信息显示出来,而不是如何将文件数据结构化。
利用超文本置标语言对元数据进行置标的语法主要是由国际标准化组织之一,国际都柏林元数据项目组织(DCMI)制定的。下面我们就以“湖南省环保局关于加强感染性‘三废’处置监督管理工作的报告”这一文件为实例,使用超文本置标语言,并引用国际标准《IS015836:2003(E)信息和文件――都柏林核心元数据集》对其进行著录,示例如图2――超文本置标语言对电子文件管理元数据进行置标的结果:
从图2可以看出,关于《关于加强感染性“三废”处置监督管理工作的报告》这一电子文件,根据国际标准《IS015836:2003(E)信息和文件――都柏林核心元数据集》共著录六个元数据,即“类型、题名、责任者、其他责任者、时间、主题词”。在超文本置标语言中,专门有一个名称为“meta”的元素用于对元数据进行置标,其置标标识符为“”。所以上述这六个元数据元素前面都加了一个“”的置标标识符。如果将其列成表格就可以看得更为清楚,示例如图3――超文本置标语言对电子文件管理元数据置标结果的分析:
从图3中的“超本文置标语言的标识符”栏中可以看出,凡是元数据,都是以“”为标识符,这是不变的,而其中的元数据内容根据则视具体情况变化,
如:或是题名,或是责任者等等。或者说,在”中的元数据内容虽然发生了变化,但其置标标识符”是不变的。超本文置标语言的这种置标特点说明了其对元数据的置标结果在自描述能力方面较强,但在语义揭示能力方面还不是很强,即其不能随着元数据的内容变化,而变化置标标识符。而且由于在超文本置标语言国际标准(HTML 4.01Specification)中对“”没有定义一个规范化的属性集合,属性的含义和值域由用户根据自己的需要在另外的文档中定义,即没有对元数据进行置标的控制机制,所以用户可以将任意名称和个数的电子文件管理元数据以“”元素属性的形式置标在“”标识符中。因此,这又容易造成了超本文置标语言对其所置标的元数据缺少控制,难以做到在不同时间或不同空间对相同内容的元数据作出
文档评论(0)