- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅谈网络环境下数字图书馆资源的检索
浅谈网络环境下数字图书馆资源的检索 (新乡学院图书馆,河北新乡453007) 摘要:文章阐述了网络环境下数字图书馆信息的检索技术,分析了在此技术上对信息检索结果的排序、分类、总结等作出处理,提出了今后网络环境下数字图书馆信息的检索技术发展方向。 关键词:搜索引擎;布尔逻辑;数字资源;图书馆 中图分类号:G250.7文献标识码:A文章编号:1007—6921(XX)13—0138—02 随着信息技术的发展和数字化时代的到来,特别是网络技术、数码存储与传输技术等的全面普及,使得人们对文献信息的加工、存储、查询、利用等方面有了新的要求,因此,数字图书馆也就应运而生。数字图书馆以组织数字化信息及其技术并提供有效服务,将分散于不同载体、不同地域的数字化信息资源以网络化方式互相联结,提供利用,实现资源共享,用户可以通过网络高效方便地查询、检索信息以获得信息服务,它作为一个海量宽带多媒体网络系统,将是未来社会人们工作、学习、生活的重要平台和前提性条件。因此,如何做好数字图书馆的资源检索并对检索结果进行分类整理将是一项重要工作。1主要的检索技术1.1字段限定检索技术 字段(field)是组成记录的基本信息单元。每一个字段都描述文献的某一方面的特征,包括外表特征和内容特征。各种文献型数据库虽然字段数量、字段名称等可能不一样,但文献的基本特征都会包括在内。综合各个数字图书馆的数据库字段,主要有:题名、作者、出版社、出版地、出版时间、关键词、分类号、目次、全文等。各个数字图书馆提供了限定检索技术字段。大多数数字图书馆均提供了题名、作者、出版社三个字段的检索,而其他字段则各有所侧重;而少数的数字图书馆只提供了关键词字段检索,其他字段差别很大。1.2索引浏览检索技术 检索完成后分析发现,通常会出现因为检索词的错误输入而产生的明显错误,这个问题可通过允许检索者从数据库中按字母排列的索引表中浏览和选择条目来解决。这对于人名检索尤其有用,因为会出现大量拼写和形式不同的名字。索引浏览检索对于不熟悉数字图书馆内部结构、资源组成的用户提供了一种直观方便的检索方法。大多数数字图书馆只提供分类目录检索,而少数数字图书馆常提供主题、字顺浏览检索。1.3截词检索技术 所谓截词(truncation),是指检索者将检索词在他认为合适的地方截断。截词符(又称通配符)的形式一般有两种,“*”和“?”,采用这种方法可以在某种程度上检索出非确定的信息,以及在检索结果较少的情况下扩大检索范围。按照截词字符的个数,可分为无限截断和有限截断;按照截词的位置,可分为左截断(后方一致)、右截断(前方一致)、左右截断(中间一致)、中间截断(前后一致),以右截断和中间截断比较常见。在西方语言文字中,一个词可能有多种形态,而这些不同的形态,多半只具有语法上的意义,从用户的角度看,它们是相同的。在中文文献中,如果两个词的某一部分相同,其内在概念上应有必然的联系,检索时不可忽视。因此,大多数检索系统都采用将检索词截断来进行检索匹配,从而在一定程度上避免漏检。1.4布尔逻辑检索技术 布尔逻辑检索技术是检索系统中应用最广泛、专业检索人员最常用的检索技术之一,同时也是最早建立的检索理论。信息专业人员在检索服务中运用布尔逻辑算符已有很长的历史,对无经验的用户来说,使用布尔逻辑算符比较生疏。它是最简单、最基本的匹配模式,其理论基础是集合论与布尔逻辑。逻辑运算有与、或、非三种。逻辑与一般用“and”、“”、“+”、或空格表示;逻辑或一般表示为“or”、“|”、“,”;逻辑非的表示方式通常有“not”、“!”、“—”。数字图书馆一般能提供这个功能。大多数数字图书馆均支持布尔逻辑检索,但是运用的逻辑算符较少。1.5词组检索(phrase)技术 词组检索也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。当用户输入一个短语时,检索系统根据禁用词表过滤掉禁用词,将有检索意义的词保留下来重新构筑检索式,提供高级检索界面,支持布尔逻辑运算,支持特征字段检索、权重检索和相邻检索,例如,以“热点新闻”作为提问关键词检索时,检索结果则仅 反馈热点新闻的内容。几乎所有的数字图书馆都支持词组检索。1.6基本/高级检索技术 基本的检索界面通常是提供给初学者使用的,它不提供复杂的查询指令,但是对于有经验的用户来说,如果想要得到最相关的结果,那么就必须使用高级检索界面来支持所要输入的复杂的查询指令。因此,一个高效的数字图书馆检索系统既要提供基本检索,还应提供高级检索,以满足不同用户的检索需要。2检索结果的输出 数字图书馆以其海量存储而著称,且支持全文检索,因此输入任一关键词,检出结果动辄成千上万,如
文档评论(0)