信息检索的途径方法.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索的途径方法

第四讲 信息检索方法与技术 天津商学院图书馆 主要内容 一、信息检索方法与途径 1、信息检索方法 2、信息检索途径 二、检索途径和检索方法的综合运用 三、检索程序 四、信息检索系统 信息检索方法 信息检索方法: 就是制定正确、恰当的检索策略为检索过程进行指导。目的是为了优化检索过程,提高检索效率,全面、准确、快速地帮助用户找到所需信息 。 常用检索方法-布尔检索 布尔检索:用布尔逻辑算符来表达检索词间的逻辑组配关系,是最基本、最常用的检索技术。 常用的布尔逻辑算符有: 逻辑或(+,OR) 逻辑与(*,AND) 逻辑非(-,NOT) 布尔检索 逻辑或(+,OR):表达检索词间的并列关系。可扩大检索范围,提高查全率。如:A+B,表明结果中含有A或B都为检索命中 逻辑与(*,AND):表达检索词间的交叉关系。可缩小检索范围,提高查准率。如:A*B,表明结果必须同时含有A和B才为命中 逻辑非(-,NOT):表达检索词间的排除关系。可缩小检索范围,提高查准率,但要慎用。如:A—B,表明结果是A中不包含B的那部分 computer adventure game  最基本的搜索方式。查找与该关键词有关的记录,在过去通常情况下相当于布尔逻辑命令中“OR”的关系,翻译过来就是:  computer (OR)adventure(OR)games  因此搜索结果中不仅有同时包含三个关键字的记录,也有仅含部分关键字串(如 computer games)和个别关键字(如computer)的记录。目前搜索引擎的趋势是默认匹配全部关键词搜索,即仅返回包含所有关键词的记录,相当于下面将介绍的“+”号和AND的关系,当然有时也有例外。 +computer +adventure +game  相当于布尔逻辑命令中的“AND”关系,翻译过来就是:  computer(AND)adventure(AND)games  因此搜索结果中只列出同时包含三个关键字的记录。在搜索条件中使用“+”号还可强制搜索引擎将一些停用词当作关键词进行搜索。比如我们搜索“who am i”时,其中“who”和“i”是停用词,我们可以在两个单词前加上“+”号强制对其进行搜索,此时的搜索条件即可为:+who +am +i。 +computer +game -adventure  翻译过来就是:  computer(AND)game(NOT)adventure  列出所有包含computer game的记录,但在其中排除有关adventure的记录。  综上所述,“+”号(AND)用于在搜索中指定涵盖某项内容,而“-”号(NOT)则用来从结果中排除某项内容。 常用检索方法-截词检索 截词检索:又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。检索系统不同,截词符也不同,常用的有:#,?,*等。 根据截词符出现的位置不同,可分为: 后截词 前截词 中间截词 截词检索-后截词 后截词:将截词符放在词根后面,前方一致。 是最常用的截词方式。主要用在词的单复数、年代、作者、查同根词等情况。 如:王伟?(可查出所有名字中含“王伟”的作者的文献);Social* (可代替social, socialist, socialistic, sociality, socialization) 截词检索-前截词 前截词:将截词符放在词根的前面,后方一致。多见于复合词较多的文献检索,也可进行一个学科的不同应用领域的检索。但有此功能的系统不多。 截词检索-中间截词 中间截词:将截词符置于检索词中间,词的前后方一致。又称“通用字符法”或“内嵌字符截断” ,该方式能解决英美拼法不同单词的书写或有些词在某个元音位置上出现的单复数的不同拼写。 如:wom?n(可代替woman, women) 社会科学?发展(可代替社会科学的发展,社会科学研究的发展等) 常用检索方法-限制检索 限制检索:限制检索是缩小或约束检索结果的方法,主要是指限定字段检索,即是指定检索词在记录中出现的字段。限制检索的方法很多,如利用前、后缀符进行的字段检索;利用系统规定的限制符、限制检索命令进行的限制检索等。 (三)限制检索 限制检索是缩小或约束检索结果的方法,主要是指限定字段检索,即是指定检索词在记录中出现的字段。 常用的字段代码有: TI(题名) AU(作者) AB(文摘) JN(刊名) PY(年代) LA(语种) …… 如: information/TI

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档