1.信息检索基础知识.ppt

  1. 1、本文档共104页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.信息检索基础知识

课题:查找有关吸烟致癌的文献 检索词: (概念提取和扩展方法) 中文:吸(抽)烟、烟草、香烟、烟、尼古丁(烟碱) 英文:Smoking、tobacco、cigarette 、nicotine 中文:癌、瘤(肿瘤)、毒素、肺癌、口腔癌 英文:cancer、 neoplasm、toxin、lung cancer、    mouth cancer 学科:医学(R)→肿瘤学(R 73 ) 相关学科:生物科学 课题:当前我国民营企业 家族化管理的研究 检索词:(概念提取和扩展方法) 民营企业、个体私营企业、私营企业、 家族企业 家族化管理、家族式管理、家族管理、 家族 管理、家族化 检索限定: (时间范围;(当前)2-3年内) (地域范围;(我国)中国大陆范围) (学科范围;管理学、企业经济) 课题:计算机网络病毒防治 检索词:(汉语词语切分方法) 计算机 网络 病毒 防治 计算机 网络病毒 防治 计算机网络 病毒防治 计算机网络病毒 防治 防护 网络病毒防治 网络安全 所属学科: 工业技术→自动化技术 计算机技术→计算机技术 3、制定检索策略编写检索式 检索策略是通过具体的检索式(又称检索提问式、检索表达式)来表述课题需求的内容以及检索词之间的关系,以保证和提高检索的查全率和查准率。它的质量直接影响到检索结果的质量。 检索式:将各检索单元(主要是检索词)之间用逻辑算符、位置算符、截词、优先符等检索系统规定的组配符连接起来,成为机器可识别和执行的命令形式。 如何编制检索式? 第二节 信息检索基础知识 检索式:单个检索项或用布尔逻辑运算符或用邻近位置算符连接后所形成的检索提问式称为检索式。 编写检索式使用的基本运算符: 布尔逻辑检索 位置逻辑检索 截词检索 字段限制检索 常用的布尔逻辑算符有三种,分别是逻辑“与” ( “AND”、“*”);逻辑“或”(“OR”、“+”) ;逻辑“非”(“NOT”、“-”)。 A B A and B A or B A not B (1)布尔逻辑运算(Boolean operator) 当检索式中同时包含多个逻辑运算符时,取值的优先顺序依次为:NOT、AND 和 OR 第二节 信息检索基础知识 截词符号 常用的有“?”、“$”和“*”等,绝大部分数据库无限截词符用“*”,少数用“?”或者“$” 截词类型 (1)后截断,前方一致。如: “comput*” 表示 computer、computers、computing等。 (2)前截断,后方一致。如: “*computer” 表示 minicomputer、microcomputer等。 (3)中截断,中间一致。如: “*comput*” 表示 minicomputer、microcomputers等。 (2)截词检索 第二节 信息检索基础知识 (3) 位置算符 邻近位置算符(W) W是with的缩写。(W)算符也可以简写为()算符,A(W)B,表示A紧挨着B,顺序不能颠倒。A和B之间除允许有一个空格、一个标志符号或一个连接号以外,不得插入任何单位或字母。 邻词位置算符(nw) A(nw)B,表示两个词的次序不变,其间可以插入n个词。 句子位置算符(S) S是sentence的缩写。A(s)B表A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。 字段位置符(F) F是field的缩写。A(F)B,表示A和B 必须同时出现在记录的同一个字段之中,但位置和次序不限,两者之间还可以任意加词。如Rice(F)Genetics/Ti 要求Rice和Genetics必在同时出现在篇名之中。 记录位置算符(C) C是citation的缩写。A(C)B 其作用等同于A and B,均表示 A和B同时出现在同一记录内,但词序不限,也不要求在同一字段内。 第二节 信息检索基础知识 (4)其它符号 1 .括号 改变运算顺序。 2 .引号 引号内的检索项以整体形式出现。精确匹配: “ ” 和《》号,给查询词加上双引号则不拆分查询词,加上书名号的查询词,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分 。3 .个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词必须出现。 【实例】在某些搜索引擎中输入“+电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准网使用“”代替“and”;欧洲专利局光盘数据库的“without”、美国

您可能关注的文档

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档