數字圖書館體系結構設計中的元數據問題文摘.doc

數字圖書館體系結構設計中的元數據問題文摘.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
數字圖書館體系結構設計中的元數據問題文摘

“数字图书馆——新世纪信息技术的机遇与挑战”国际研讨会·2002·国家图书馆 数字图书馆元数据方案的设计与体系结构和互操作性问题 Metadata Designing from the Perspective of DL Architecture 刘炜 Liu Wei 上海图书馆,上海 Shanghai Library, Shanghai email: wliu@ 张亮 Zhang Liang 复旦大学计算机与信息技术系,上海 Computer and Information Science Department, Fudan University, Shanghai email: zhangl@ 摘要:本文分析了国内外一些著名的数字图书馆解决方案中的元数据方案,指出元数据方案的制定不能简单地理解为确定、选择或扩展一种元数据描述标准,并指定置标格式的过程,而应从整个数字图书馆的体系结构来考虑,因为元数据方案在很大程度上决定了数字图书馆各类对象的数据结构,影响着数字资源的管理方式和构件模型。元数据方案必须体现数字图书馆与一般的因特网应用的不同之处,这一不同之处主要在于把因特网上形形色色的数据类型都视为(或转化为)具有特定结构的“包”,以面向对象的方法设计的高度灵活的、可扩展的、具有互操作能力的体系结构,提供基于内容的组织、发布和检索等服务。设计的出发点是将资源的存储、表现、传输相分离,提供分层次的服务,元数据提供了所有这些功能语义内容与相互联系的基础。 本文探讨了静态的和平面的元数据方案的许多重大缺陷,例如不可能解决资源描述通用性和特殊性的矛盾,不可能从根本上有效地解决互操作性问题等,认为一套好的元数据方案必须解决站点级元数据与资源级元数据的关系问题,必须明确达到不同的系统对于元数据不同的功能需求,例如对于版权属性的揭示、对于资源保存属性的考虑、对于系统开放性的考虑等等,对利用本体论(Ontology)从方法论层面上解决元数据的互操作问题提出了初步设想。 主题词:元数据,数字图书馆,互操作,数字图书馆体系结构 引言 元数据是关于数据的数据,在数字图书馆中它提供完整的数据描述形式,为分布的、由多种数字化资源有机构成的信息体系提供规范、普遍的描述方法和整合工具与纽带,是广泛分布的数字图书馆资源站点具有充分的互操作性和可扩展性的基础,是提供数字图书馆中资源描述、资源发现、资源处理、资源评价与排序以及资源的人机交互和理解的基本要素,它还承担向数字图书馆中高层协议中间件提供标准数据访问接口的功能。 互联网上的所有应用都是建立在协议标准的基础之上,随着互联网向语义网络(Semantic Web)发展,网络将不再仅仅提供简单的通讯平台,而能够通过规范的语义表达,达到机器之间的理解和人机交互,从而更好地为人们共享知识、交流思想服务。这也正是数字图书馆所要实现的目标。许多新的、基于人类认知和语义的协议将被引入到网络中来,这些协议的基础就是元数据,各学科和应用领域都会产生大量的元数据、元语言以及语义“本体(Ontology)”方案。数字图书馆将成为网格计算的一种重要服务。 目前的“元数据运动”呈现百花齐放之势,一些方案试图将元数据统一到只有一种或几种,但在开放环境中这种努力看来将是徒劳的,任何“标准”都不可能解决所有问题,数字图书馆元数据方案的设计必须正视这个现实,应该在更高的层次上探索并解决各种方案的并存、互操作问题。 本文第二部分探讨了数字图书馆的体系结构及其常见的几种实现方案,分析了元数据在其中所起的作用。第三部分介绍了目前国际上应用较为广泛的几种主要元数据方案的设计思想和国内的一些做法。第四部分分析了这些元数据方案的不足和设计的缺陷。第五部分重点提出了改进方法并讨论未来的发展方向 数字图书馆体系结构与元数据方案 数字图书馆不是Web,但是数字图书馆根植于Web,起码现在看起来如此。Web通过URL定位服务器地址,通过超文本传输协议http将html文件连接成一张大网,通过MIME协议把各类文件交给客户端自行处理,通过CGI、SQL提供结构化数据的发布,通过ASP、JSP等实现动态管理和更多功能。然而人们希望Web是大型连锁超市而不是杂货铺。人们希望Web这张大网直接连接数字资源而无需通过服务器地址,于是引入统一资源名URN系统(RFCs 2141 2168);人们希望html文件能蕴含更多的“结构”和“关系”,而不仅仅是关于显示和链接,于是引入了XML;人们希望电脑能够“读懂”XML中的特定内容,在人们得到信息之前,机器之间已经进行了成千上万次交互,经过选择、匹配、汇总、过滤,把人们真正想要的东西,按照人们想要的形式呈现出来,于是引入了RDF,一种资源描述语法,以及WOL,一种知识本体的定义语言。 数字图书馆是一个交叉研究领域,目的是解

您可能关注的文档

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档