- 7
- 0
- 约6.56千字
- 约 81页
- 2017-11-28 发布于湖北
- 举报
第三章 计算机检索基础
逻辑“非”(NOT或—) 逻辑“非”(NOT或—) “NOT”算符是排除含有某些词的记录,其逻辑提 问表达式为“A NOT B”或“A-B”,即检出的记录 中只能含有“NOT”算符前的检索词 A,而不能同时 含有“NOT”后的检索词 B。 “NOT”的作用是缩小检索范围,提高检准率。 在联机检索中可降低检索费用。 例如:“皮鞋 NOT 高跟鞋” 由于“NOT”算符有排除掉相 关文献的可能,在实际检索 中应慎重使用。 A B B A not B 逻辑“非”运算 示例 非共产主义人生观 B821.2(人生观、人生哲学中除共产主义人生观外的那一部份) A:人生观、人生哲学 B:共产主义人生观 A not B A-B “优先级”问题 当布尔运算符在一个检索式中连续出现时,它们的“级别”是不同的。一般的次序是:“()”最高“-”优先级第二,“*”第三,“+”最低。 ()NOTANDOR 如: 信息OR情报 NOT 经济 (信息OR情报)NOT 经济 检索结果不同。 布尔逻辑的运算可以进行同类项的合并。 如:A*B+A*C=A*(B+C) 然而,在使用布尔逻辑时,必须注意以下几条交换规则: A*B=B*A A+B=B+A A-B≠B-A 短语检索(精确检索) 短语检索(精确检索) 检索符 “ ” 用于检索固定短语或专有名词 在短语或专有名词前后加双引号,系统将其按词组对待,不再将其分割按单词检索。 截词检索与通配检索 用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。可以扩大检索范围,提高查全率,主要用于西文数据库检索,中文数据库通常不使用。 截词检索类型:根据截词的位置不同,分为前截断、后截断、中截断;根据截断的数量不同,分为有限截断和无限截断。 天津工业大学在20世纪90年代所申请的专利。 后截断:是前方一致检索,截词符放在被截词的右边,是最常用的截词检索技术。后截断主要用于下列检索:①词的单复数检索,如company与companies; ②年代检索,如199?(九十年代);③词根检索,如socio*,可以检索sociobiology,socioecology,sociology等20多个词汇。截词符号可代表若干个字符。 前截断:截词符放在被截词的左边,可与后截断一同使用。例如输入*ware,可检software、hardware等。截词符号可代表一个或以上字符。 中截断:把截词符放在词的中间。如organi?ation,可检索organisation、organization。这种方式查找英美不同拼法的概念最有效。截词符号仅代表一个字符。 截词举例 符号:*,? 后截断:librar* ? library, libraries, librarian,… 前截断:*magnetic ? magnetic, electro-magnetic, electromagnetic, thermo-magnetic, … 中截断:colo?r ? colour, color 截词符? 中截一字符,后截断n个字符 如 wom?n 可以检索出: woman, women 又如 computer?——以computer词干开头的词 可以检索出:computer、computers、computing、computerize、computerise 注意:截词是计算机信息检索的一项重要特性,不同数据库有不同的截词符,大多数为“?”。 根据截断的数量不同,分为有限截断和无限截断。 无限截断:不限制被截断的字符数量,例如输入educat?,可以检索educator,educators,educated,educating,education educational,等等。 有限截断:限制被截断的字符数量,例如输入educat**,表示被截断的字符只有两个,可以检索educator,educated两个词。 检索天津工业大学的所有老师、学生在2012年被EI(工程索引)收录的文献,如何构造检索式? 检索天津工业大学的所有老师、学生在2010年被EI(工程索引)收录的文献,如何构造检索式? Tianjin Polytechnic University Tianjin Polytech. University Tianjin Polytech. Univ.
原创力文档

文档评论(0)