信息检索技术方法及搜索引擎.docx

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索技术方法及搜索引擎第一节 : 信息检索技术 数字资源的检索技术布尔逻辑检索技术 1 截词检索技术 2 邻近检索技术 3 字段检索技术 4 布尔逻辑检索是指通过标准的布尔逻辑关系算符来表达检索词与检索词间的逻辑关系的检索方法 . 主要的布尔逻辑关系词有 : 逻辑与 (AND), 逻辑或 (OR), 逻辑非 (NOT) 布尔逻辑检索技术逻辑与 逻辑乘 : and 或* 表示 组配方式 :A*B 或者 A and B 表示两个概念的交叉和限定关系 , 只有同时含有这两个概念的记录才算命中信息 作用 : 增加限制条件 , 即增加检索的专指性 , 以缩小提问范围 , 减少文献输出量 , 提高查准率 . 逻辑或 又称逻辑和 :or,+ 组配方式 :A OR B 或者 A+B,表示检索含有 A 词, 或含有 B 词, 或同时包含 A,B 两词的文章 . 作用 : 放宽提问范围 , 增加检索结果 , 起扩检作用 , 提高查全率 . 逻辑非 又称逻辑差 : not - 组配方式 :A-B, 表示检索出含有 A 词而不含有 B 词的文章 . 作用 : 逻辑非用于排除不希望出现的检索词 , 它和 * 的作用相似 , 能够缩小命中文献范围 , 增强检索的准确性 . 例如检索 : 打印机驱动程序 查询关键词 : 打印机 , 驱动程序 检索表达式 : 打印机 AND 驱动程序 例如检索 : 微型计算机 方面的有关信息查询关键词 : 微型计算机 , 微机 检索表达式 : 微型计算机 OR 微机 布尔逻辑检索举例 布尔运算符优先级比拟 有括号时 : 括号内的先执行 ; 无括号时 :NOT AND OR 例: 检索 唐宋诗歌 的有关信息 . 关键词 : 唐, 宋, 诗歌 ; 检索表达式 : ( 唐 OR 宋)AND 诗歌 ; 唐 AND 诗歌 OR 宋 AND 诗歌 ; 错误表达式 : 唐 OR 宋 AND诗歌 ; 唐 AND 宋 AND诗歌 ; 唐 OR 宋 OR 诗 歌 ; 唐 AND 宋 OR诗歌; 布尔逻辑运算符优先级请注意 在不同的数据库中 , 所使用的逻辑符号可能是不同的 , 有的用 and,or,not 有的用 *,+,-. 一些检索工具会完全省略任何符号和关系 , 直接把布尔逻辑关系隐含在菜单中 . 一些网络检索工具如搜索引擎甚至用 〕,,,-( 即空格 , 逗号 , 减号 ) 来表示 . 主要应用于西文数字资源的检索 定义 : 是指在检索式中用专门的符号 ( 截词符号 ) 表示检索词的某一局部允许有一定的词形变化. 作用 : 主要是提高查全率 截词符一般用 或* 表示 截词检索技术截词位置 按截词位置可分为前截词 , 后截词 , 前后截词和中间截词 ; 按截断字符数的不同 , 可分为有限截断和无限截断 . 右截词 , 又称后截词 , 前方一致 . 允许检索词尾有假设干变化 . 例如 comput* 将检索出 computer ,computing,computerised,computerized,computerization 等结果 . 中间截词 , 又称前前方一致 . 允许检索词中间有假设干变化 . 例如 wom*n,检索到 woman,women 的结果 . 英美的不同拼法 ,defen*e 可同时检出 defence 和 defense 的结果 . 左截词 , 又称前截词 , 前方一致 , 允许检索词前有假设干变化 , 例如 *physics 就可检索到 physics,astrophysics,biophysics,chemophysics,geophysics 等词的结果 . 前后截词 : 词干的前后各有一个截词符 , 允许检索词的前端和尾部各有假设干变化形式 . 如computer 可 检 索computer,computers,computerize,computerized,computerization,minicomputer,minicom puters,microcomputer,microcomputers 等结果 . 请 注 意 在不同的数据库和联机检索系统中 , 所使用的截词符号没有统一的标准 , 有的用 , 有的用 *, 有的用 #, 用的用 $ 等. 即便常用的 和* 在不同的数据库中其用法也是不一定相同的 . 在允许截词的检索工具中 , 一般是指右截词 , 局部支持中间截词 , 左截词比拟少见 . 我们将要使用的一些数据库 , 一般用 * 代表一个字符串 , 用 代表任意一个字符 . 邻近检索又称位置检索 , 主要是通过检索式中的专门符号来规定检索词在结果中的相对位置 . 例如检索 生物防治 的文献 , 假设用检索式 biological

文档评论(0)

文档查询,农业合作 + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体土默特左旗农特农机经销部
IP属地内蒙古
统一社会信用代码/组织机构代码
92150121MA0R6LAH4P

1亿VIP精品文档

相关文档