- 5
- 0
- 约5.25千字
- 约 11页
- 2018-10-14 发布于福建
- 举报
国内外同构聚合检索系统比较的研究
国内外同构聚合检索系统比较的研究
摘要:跨库检索系统已经发展到基于元数据收集的同构聚合检索阶段。从产品功能和产品成熟度两方面考虑,选取了国内外五种同构聚合检索系统Summon、Primo、WorldCat Local、百链、书生同构跨库检索系统进行研究。在对各系统的元数据涵盖范围、功能特点等方面进行比较的基础上,总结了目前同构聚合检索系统软件即服务的共同销售模式,并提出系统主要存在的问题:国外系统在国内实施时需要结合对异构数据库的实时检索方式进行检索,而国内系统按需下载的免费元数据质量有待加强。最后对改进同构聚合检索应用效果提出两点建议。
关键词:同构聚合检索系统 跨库检索系统 信息检索 资源整合
1、同构聚合检索系统的兴起
随着各类商业性学术资源的大量引进和广泛使用,学术信息由稀缺资源发展成为海量异构资源集。科技用户面对着各资源提供商丰富多样的检索界面和指令,需要熟悉不同的检索系统。限于精力等原因用户往往陷入一种使用困境:被迫放弃大量数据源,只选择一、二种自己研究最常用的数据源,依靠它们作为自己的资源来源,这很容易造成相关重要资源的遗漏。为解决这一问题,跨库检索系统应运而生。根据其技术发展路线可分为两个阶段:依赖计算机能力和标准协议对异构数据库的实时检索阶段和基于元数据收集的同构聚合检索阶段。
对异构数据库的实时检索方式是借助于计算机强大的处理能力,实时地对分布异构资源进行检索。跨库检索系统充当一个中间代理的角色,接受用户的查询请求后,基于对资源检索协议和平台的分析构建查询语法,并行地发出查询请求,并将获得的检索结果整合显示在系统内。其优点是为用户屏蔽了不同数据源在平台、界面、检索指令等方面的差异,可以通过一个简单的界面访问多种异构、分布的资源。缺点在于实时检索受制于待检数据库的访问速度和检索性能,检索效率难以提高。目前国内的跨库检索服务多采用此方式实现。
基于元数据收集的同构聚合检索则通过抽取、映射和导入等手段对分布异构资源的元数据(也可能包括对象数据)进行收集和聚合,安装存储于本地系统或者中心系统平台,提供统一的检索和服务。该方式的优势是数据经过收集转换后不仅格式统一,而且结构清晰,可以按照需求建立各种分类体系,或者按照更高级的知识――本体对数据进行组织和管理。检索过程可控、检索速度提高,技术解决方案本身就明显优于实时检索方式。但由于图书馆等信息服务机构需要整合的多是商业性学术资源,而这些资源的提供商往往不同意用户将其元数据经过二次收集和聚合后,安装在另外一个系统平台上,导致该解决方案一直不具备可行性。但是近几年来,主流资源提供商(主要是国外资源提供商)逐渐意识到开放元数据的双赢性,已与几家软件生产商达成协议,促使集中仓储元数据进行同构检索的商业化软件最终得以萌芽。自2009年SerialsSolutions公司推出第一个同构聚合检索系统Sum-mon以来,多家软件厂商推出了类似解决方案的跨库检索系统。由于其解决方案的先天优异特性,应该可以说,基于元数据收集的同构聚合检索将逐渐取代对异构数据库的实时检索,成为跨库检索系统的主流实现方式。
虽然国外多所高校图书馆,如悉尼大学、密歇根大学等,基于元数据收集的同构聚合检索系统得到了具体应用并取得了很好的应用效果,但引入国内时间相对较短。同时由于中文资源提供商的数据封闭性,相关软件系统在国内的具体实施难度更大。因此本文的主要目的并不是对系统进行评价,而是在对此类系统的元数据涵盖范围、功能特点等方面进行比较的基础上,总结目前同构聚合检索系统的一般特点,发现问题,进而为各信息服务机构根据各自实际选择相关产品并有效实施提供建设性意见。
2、国内外五种同构聚合检索系统比较
从各软件厂商的营销策略出发,此类跨库检索系统被冠以不同名称,有的将其称为“互联网级探索发现服务、有的命名为“资源发现与获取解决方案”。笔者根据前文对跨库检索系统发展阶段的分析,从产品功能和产品成熟度两方面考虑,选取了国内外五种同构聚合检索系统,具体包括:SerialsSolutions公司的Summon、Ex Libris公司的Pri-mo、OCLC公司的WorldCat Local、超星公司的百链、书生公司的同构跨库检索系统。
2.1 比较结果分析
五种同构聚合检索系统都通过优先对元数据进行整合存储和预处理、为读者提供了互联网搜索引擎方式的检索体验,检索具有使用方式简单、响应速度快、检索结果无重复、格式统一等优点。在实现跨库检索同时,都能实现准确定位全文链接。
(1)元数据涵盖范围比较
同构聚合检索系统以类似互联网搜索引擎的方式提供服务,读者检索的是应用系统自身建立的元数据库,而非各信息服务单位真实的订购数
原创力文档

文档评论(0)