- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索技术方法的搜索引擎.doc
信息检索技术方法及搜索引擎
第一节:信息检索技术
数字资源的检索技术
布尔逻辑检索技术
1
截词检索技术
2
邻近检索技术
3
字段检索技术
4
布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索方法.
主要的布尔逻辑关系词有:逻辑与(AND),逻辑或(OR),逻辑非(NOT)
1 布尔逻辑检索技术
逻辑与
逻辑乘: and或*表示
组配方式:A*B或者A and B 表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息
作用:增加限制条件,即增加检索的专指性,以缩小提问范围,减少文献输出量,提高查准率.
逻辑或
又称逻辑和:or,+
组配方式:A OR B或者A+B,表示检索含有A词,或含有B词,或同时包含A,B两词的文章.
作用:放宽提问范围,增加检索结果,起扩检作用,提高查全率.
逻辑非
又称逻辑差: not -
组配方式:A-B,表示检索出含有A词而不含有B 词的文章.
作用:逻辑非用于排除不希望出现的检索词,它和*的作用相似,能够缩小命中文献范围,增强检索的准确性.
例如检索:打印机驱动程序
查询关键词:打印机,驱动程序
检索表达式:打印机 AND 驱动程序
例如检索:微型计算机方面的有关信息
查询关键词:微型计算机,微机
检索表达式:微型计算机OR 微机
布尔逻辑检索举例
布尔运算符优先级比较
有括号时:括号内的先执行;
无括号时:NOT AND OR
例:检索唐宋诗歌的有关信息.
关键词:唐,宋,诗歌;
检索表达式:
(唐 OR 宋)AND 诗歌;
唐 AND 诗歌 OR 宋 AND 诗歌;
错误表达式:
唐 OR 宋AND诗歌;
唐 AND 宋AND诗歌;
唐 OR 宋OR诗歌;
唐AND 宋OR诗歌;
布尔逻辑运算符优先级
请注意
在不同的数据库中,所使用的逻辑符号可能是不同的,有的用and,or,not 有的用*,+,-.
一些检索工具会完全省略任何符号和关系,直接把布尔逻辑关系隐含在菜单中.
一些网络检索工具如搜索引擎甚至用〕,,,-(即空格,逗号,减号)来表示.
主要应用于西文数字资源的检索
定义:是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化.
作用:主要是提高查全率
截词符一般用 或*表示
2 截词检索技术
截词位置
按截词位置可分为前截词,后截词,前后截词和中间截词;
按截断字符数的不同,可分为有限截断和无限截断.
右截词,又称后截词,前方一致.允许检索词尾有若干变化.例如comput*将检索出computer ,computing,computerised,computerized,computerization等结果.
中间截词,又称前后方一致.允许检索词中间有若干变化.例如wom*n,检索到woman,women的结果.英美的不同拼法,defen*e可同时检出defence和defense的结果.
左截词,又称前截词,后方一致,允许检索词前有若干变化,例如*physics就可检索到physics,astrophysics,biophysics,chemophysics,geophysics等词的结果.
前后截词:词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式.如 computer 可检索computer,computers,computerize,computerized,computerization,minicomputer,minicomputers,microcomputer,microcomputers等结果.
请 注 意
在不同的数据库和联机检索系统中,所使用的截词符号没有统一的标准,有的用 ,有的用*,有的用#,用的用$等.
即便常用的 和*在不同的数据库中其用法也是不一定相同的.
在允许截词的检索工具中,一般是指右截词,部分支持中间截词,左截词比较少见.
我们将要使用的一些数据库,一般用*代表一个字符串,用 代表任意一个字符.
邻近检索又称位置检索,主要是通过检索式中的专门符号来规定检索词在结果中的相对位置.
例如检索生物防治的文献,若用检索式biological*control检索,则会将抑制生物(control biological)的文献也查出来,这显然不是所需文献.
主要有相邻位置算符(W),(nW),(N),(nN),句子位置算符(S),字段算符(F).
3 邻近检索技术
(W) 算符
(W)是with(word)的缩写,表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号.
如biological (W) control相当于检索biological control
CD (W) R
您可能关注的文档
- 企业可借宗教立心 不可借宗教敛财.doc
- 企业培训师二级理论.doc
- 企业并购案例尽职调查的效应分析.doc
- 企业并购财务整合风险的对策.doc
- 企业改制登记注册说明.doc
- 企业改制重组操作实务及风险防范.ppt
- 企业文化及人力资源管理体系-初稿.doc
- 企业文化建设及HR管理.doc
- 企业文化手册编制及提炼.doc
- 企业文化篇的产品文化篇、专卖店管理的它.doc
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)