第3讲 息检索技术与方法.pptVIP

  • 24
  • 0
  • 约 66页
  • 2017-01-23 发布于河南
  • 举报
一、信息检索概述 1.数据和数据库: 数据:描述事物的符号。 数字、文字、图表、图象、声音等。 数据库:数据的集合 数据库使用注意事项 二、信息检索技术 1.布尔检索法 2.截词检索法 3.位置检索法 4.字段检索法 1、布尔检索法 布尔运算符有三种,分别是 逻辑或 OR; 逻辑与 AND; 逻辑非 NOT。 逻辑或: A+B、 A OR B 用来连接同义或相关的词 增加检索结果 如: railway OR railroad 逻辑与:A*B 、A AND B 逻辑非:A-B 、A NOT B 2.截词检索法 截词:是指检索者将检索词在认为比较合适的地方截断,也称模糊检索,又称词干检索法 。 截词检索:用截断的词的一个局部进行的检索,即利用检索词的词干加上截词符号去数据库中进行检索。凡是满足这个截词所有字符(串)的记录,系统都为命中。 三、信息检索技术 2.截词检索法 截词检索在西文数据库中广泛使用。通常是在词干后可能变化的位置加上截词符号。检索词的单复数形式,同一词英、美不同拼法,词根相同的词都可用截词检索。这样既可减少检索词的输入量,又可扩大查找范围,提高查全率。 2.截词检索法 截词符号:一般为“ ?”或** 表示截词的截断符号,各检索系统有不同规定,没有统一标准。 种类: 按截词位置

文档评论(0)

1亿VIP精品文档

相关文档