- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第=届海峡两岸抖技资讯研讨会暨第十三届全国计算机情报管理字术研讨会论丈集
都柏林核心集综述m
中国国防科技信息中心王新
(北京市l22信箱,100036)
【摘要l本文在综合阐述了都柏林核。集的发展简史元素定义及其作用的基础上,就都柏林
核心集的应用现状、标准化建设等方面的问题进行了分折,并提出了自己的建议。
【关奠词l都柏林核a集元数据搜索引擎标准检索语言蹦L
一、引言
早在60年代,为r有效地描述数掘集,JackMyers定义J’无数据(Metadata)帕概念。根
据鹾简单的定义,元数据就挂天r数据的数据“dataab㈣Idata”,用来描述与某一对象商芙
的属性信,自、。一部作品的f{’者、内容梗概、刨佧时间等就是这部作品的元数据;煳旧馆的目录
索引卜片上的信息就是关卜~份文献的元数据。山r描述对豫、范围和I={的不同,许多团体都
相继开发Hl了适合特定范阐需求的元数据结构,不同格式的元数据的属性和实现方法都不尽相
同。
随着社会信息化发展,人们经常发出知识爆炸的感慨,然而,真正让人感受到知识爆炸的
威力,却是在网络技术的发展吼及因特网(fnterne,+)的r泛使用之后。不沦何时们地,只要
你能哆连入闻特恻,那么,网上遍加世抖任何角落的信息就存uj能在瞬{、阿J出现在你面前。如何
在无序的信启.海洋中寻找到矗己所需要的内弈,是信息川户翮信息的提供者所必须面对的剐
avlska、1
题。目前,互联网J二有许多的搜索引擎,如,Yahoo、A1l nfoSeek等,它仃』搜索能
力之强,是毋庸置疑的,在帮助用户寻找所需信思方面发挥了重要的作Hj。然而,在精确地返
同用户所需信息方面还远不蘸满足要求。一个曩耍的原闪足信息资源的提供者只重视信息资源
的内容.而忽视了信息资源的描述。
例Ⅻ,笔者曾通过A]caVlst.i试图搜索英圜~种l毡子{lfj刊“ARIADNE”,结果发现了5二r多
个参考词.并且返回r2121个J主接,有天这些连接的内奔说明是}_分有限的,并日不很明确,
冈此,你不得不耐心地 垭接到站点,A石i#缨内窬.才能确定是否为己所需,直到第20
次的连接才出现了真止需要的l~释:H~芍历},荇种流{』的搜索引擎都普遍支持全文检索,只
露数据库中的记录内容o』刖户榆索词匹配,该记采就会fr为怆索结粜返叫,如果没订对资越《:晌
比较明确的描述,川户根难知道遂|=J]的结果是别一个7,段的l^』窬。例如,你要搜索某个公t≈的
名称,在返同的结果中,你却没订办法知道,这些},l粜真的是公司名称还足它所礼:的街道或城
市的名称。这些问题反映出对资源进行适当描述是多么-莛要。
电子信息资源的描述不仅可必帮助搜索引擎提高效率,也是信息存储、传递、检索等i.{{.
的重要基础。都柏林核心集(DublnCore)干{。为lnj’信息资源描述的解玖方案,就足在这抒
的背景F产生的。
二、都柏林棱心集发展简述m
都柏林核心集最早是为r解决Web资源描述而产,上的。i!)95年3爿.OCLC(OnlineComputer
LibraryCenter)和NCSA(Nationa】CentelforStlpercOlllpalngApplications)联合赞助了
第一届都柏林核心专题研讨会。水自图旧馆、计算机及ff关领域的52名专家、学者在会上共
同探讨了基r网络的电子信息资源的描述蛔题,对提交的元数据元素核心集进行r讨论,并达
成了一致意见.创建J.都柏林核心集。作为网络信息资源描述的基础,都柏林核心集主耍足为
了解决嘲络电子文献的发现问题,因此只包含了能够描述电f义献基奉特征的元素,而排除了
能够由都柏林核心集扩展而来的元素,如,播述档案、帐目等信息的元索,最后确定_『“Suhjeet”
等13个元素,并明确了元素的插述语义。
1996年4月,在英格兰的沃威克Lwarwiek)举行的第二幅争题研讨会,已经jJl展成为一
采稿日期:995 3【稿件编号:0}9作者E—ma“war}gx毗efⅢ:1·t(
一230——
第二届海峡两岸科技资讯研讨套暨第十三届全国计算机晴报管理学术研讨会论文集
/卜闯际性的讨论会。这次会}义讨论了元数据体系结构概念基础.即所渭的“沃成兜框架”(the
文档评论(0)