第二讲信息检索策略.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索与利用 主讲人 潘定红第二讲 信息检索策略(2) 信息及其类型 信息检索策略 -检索工具/检索系统 -检索方法 -检索途径 -检索技术 -检索策略* 计算机信息检索技术 计算机检索过程中,为保证检索结果准确全面、经济高效,各计算机检索系统均为用户提供了多种不同的检索技术,其中使用最普遍的就是布尔逻辑检索、截词检索和位置检索 这几种检索技术是在各类机检系统中常用的,但由于不同的机检系统使用不同的检索软件,所支持的检索技术不同、采用的检索算符也不同,因此实际检索时,应注意查看所用检索系统的说明 1、布尔逻辑检索(Boolean Logical) 就是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献 逻辑算符主要有:逻辑与(And/*)、逻辑或(Or/+)、逻辑非(And Not/Not/-) 逻辑与:并且/And/*/和 常用检索式为: A 并且 B A and B A * B A B(网络搜索引擎) 含义:检索词A和检索词B用“与”组配,表示检出同时含有A、B两个检索词的记录 作用:此算符适于连接有限定关系或交叉关系的词,能增强检索的专指性,使检索范围缩小,提高检准率 逻辑或:或者/Or/+/, 常用检索式: A 或者 B A or B A+B A,B(搜索引擎) 含义:检索词A和检索词B用“或”组配,它表示检出所有含有A词或者B词的记录 作用:此算符适于连接有同义关系或相关关系的词,如同义词、近义词、相关词、上位词、下位词等,扩大了检索范围,增加检索结果,提高查全率(暗含去重的功能) 逻辑非:不包含/Not/- 常用检索式: A 不包含 B A not B A – B(搜索引擎) 含义:检索词A和检索词B用“非”组配,它表示检出含有A词,但同时不含B词的记录 作用:此运算适于排除那些含有某个指定检索词的记录。和逻辑“与”运算的作用类似,可以缩小检索范围,增强检索的准确性。但如果使用不当,将会排除有用文献,从而导致漏检 运用:通过检索结果分析,找出不相干信息的共同特征,使用“逻辑非”语法排除 注意 布尔逻辑的运算可以进行同类项的合并,如:A*B+A*C=A*(B+C) 例如:毒品*法律+毒品*法规=毒品*(法律+法规) 在使用布尔逻辑时,必须注意以下几条交换规则: A*B=B*A:毒品*法律=法律*毒品 A+B=B+A:法律+法规=法规+法律 A-B≠B-A:云南民族-旅游≠旅游-云南民族 2、位置检索 是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),用来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录 这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符 常用位置算符: (w)/(wn)/(nw);(n)/(nN); pre;ADJ 邻近位置检索:w/with X w Y (X后面紧接着Y,中间只能出现一个空格或标点符号) X wN Y (X后面紧接着Y,而且X和Y之间最多只能有N个词) 例:tax w8 reform(Ebsco) tax pre/8 reform(proquest) (n)算符near X n Y (X靠着Y,可前可后) X nN Y (X和Y之间最多只能有N个词,X和Y可前可后)。 例:comput* n2 techno* 将课题名称改写为检索式 检索关键词“中医药”-Chinese Traditional Medicine traditional(n)Medicine (n)chinese 检索关键词 “白色污染”white pollution, white-pollution white(W)pollution 或 white()pollution Trends in alternative medicine use in the United States trends(1w)alternative()medicine ()use(2w)United()States nanotube、nano tube、nano-tube Nanotube or nano()tube 3、截词检索(Truncation) 是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索 名词的单复数形式,词的不同拼写法,词的前缀或后缀变化,模糊查询时,均可采用此方法 可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,简化检索过程,降低检索费用等作用 截词的方式:按截断部位可分为右截断、

文档评论(0)

zilaiye + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档