- 1、本文档共109页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
搜索引擎优化信息检索技术
信息检索技术、方法及 搜索引擎 徐淑慧 xushuhui@ 哈尔滨工程大学图书馆信息服务部数字资源的检索技术 布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索方法。 主要的布尔逻辑关系词有:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT) 逻辑与 逻辑乘: “and”或“*”表示 组配方式:A*B或者A and B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息 作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率。 逻辑或 又称逻辑和:“or”、“+” 组配方式:A OR B或者A+B,表示检索含有A词,或含有B词,或同时包含A、B两词的文章。 作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率。 逻辑非 又称逻辑差: “not” “-” 组配方式:A-B,表示检索出含有A词而不含有B 词的文章。 作用:逻辑非用于排除不希望出现的检索词,它和“*”的作用相似,能够缩小命中文献范围,增强检索的准确性。 例如检索:“打印机驱动程序” 查询关键词:打印机、驱动程序 检索表达式:打印机 AND 驱动程序 例如检索:“微型计算机”方面的有关信息 查询关键词:微型计算机、微机 检索表达式:微型计算机OR 微机 布尔运算符优先级比较 有括号时:括号内的先执行; 无括号时:NOT AND OR 例:检索“唐宋诗歌”的有关信息。 关键词:唐、宋、诗歌; 检索表达式: (唐 OR 宋)AND 诗歌; 唐 AND 诗歌 OR 宋 AND 诗歌; 错误表达式: 唐 OR 宋AND诗歌; 唐 AND 宋AND诗歌; 唐 OR 宋OR诗歌; 唐AND 宋OR诗歌; 请注意 在不同的数据库中,所使用的逻辑符号可能是不同的,有的用“and、or、not” 有的用“*、+、-”。 一些检索工具会完全省略任何符号和关系,直接把布尔逻辑关系隐含在菜单中。 一些网络检索工具如搜索引擎甚至用“︺、,、-”(即空格、逗号、减号)来表示。 主要应用于西文数字资源的检索 定义:是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。 作用:主要是提高查全率 截词符一般用“?”或“*”表示 截词位置 按截词位置可分为前截词、后截词、前后截词和中间截词; 按截断字符数的不同,可分为有限截断和无限截断。 右截词,又称后截词、前方一致。允许检索词尾有若干变化。例如comput*将检索出computer 、computing、computerised、computerized、computerization等结果。 中间截词,又称前后方一致。允许检索词中间有若干变化。例如wom*n,检索到woman、women的结果。英美的不同拼法,defen*e可同时检出defence和defense的结果。 左截词,又称前截词、后方一致,允许检索词前有若干变化,例如*physics就可检索到physics、astrophysics、biophysics、chemophysics、geophysics等词的结果。 前后截词:词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。如?computer?可检索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputer、microcomputers等结果。 请 注 意 在不同的数据库和联机检索系统中,所使用的截词符号没有统一的标准,有的用“?”,有的用“*”,有的用“#”,用的用“$”等。 即便常用的“?”和“*”在不同的数据库中其用法也是不一定相同的。 在允许截词的检索工具中,一般是指右截词,部分支持中间截词,左截词比较少见。 我们将要使用的一些数据库,一般用“*”代表一个字符串,用“?”代表任意一个字符。 邻近检索又称位置检索,主要是通过检索式中的专门符号来规定检索词在结果中的相对位置。 例如检索“生物防治”的文献,若用检索式“biological*control”检索,则会将“抑制生物”(control biological)的文献也查出来,这显然不是所需文献。 主要有相邻位置算符(W)、(nW)、(N),(nN),句子位置算符(S),字段算符(F)。 (W) 算符 (W)是with(word)的缩写,表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。 如biologic
您可能关注的文档
最近下载
- 辽2015T402 民用建筑空调与供暖冷热计量设计与安装.docx
- 《学校绿化养护服务方案》.doc
- 河北建筑国企招聘笔试题库.pdf VIP
- 副高卫生职称《放射医学》(题库)模拟试卷三.docx VIP
- 第四章原产地规则.ppt VIP
- 《海南全景解析》课件.ppt VIP
- 2016年张掖市中考化学试卷及答案.doc VIP
- AP微观经济学 2019年真题 附答案和评分标准 AP Microeconomics 2019 Real Exam with Answers and Scoring Guidelines.pdf VIP
- 外研版八年级上册英语单词表(附自测单).doc
- 入职通知书模板 .doc VIP
文档评论(0)