检索符号教学讲义.ppt

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
检索符号教学讲义.ppt

第三章 计算机检索原理 计算机检索概述 1.计算机检索的发展 2.计算机检索的原理 3.数据库简介 4.计算机检索中常用的运算符 5.计算机检索策略的制定及调整 1.计算机检索的发展历史 计算机检索从产生到现在经历了4个阶段: (1)20世纪50年代,以批量处理、脱机检索为特点的第一阶段 (2)20世纪60年代末,以联机检索为特点的第二阶段 (3) 20世纪70年代,以联机检索为特点、伴随光盘检索异军突起的第三阶段 (4)20世纪90年代,基于互连网的数据库检索和Internet网上信息检索并重的第四阶段 2.计算机检索的原理 计算机检索的原理就是利用计算机将用户所提出的检索标识与检索系统中的标引标识进行比较,将匹配的文献视为命中。 检索标识是检索者根据对课题的分析,制定出的既能反映课题的要求,又符合计算机检索要求的检索语言,其中包括适当的检索词,以及合适的逻辑算符和位置算符。 3.文献数据库简介 3.1 数据库的定义和类型 3.1.1 定义:按一定方式存储的相互关联的数据集合。 3.1.2 数据库类型: 文献目录型数据库(bibliographic database). 也称为书目数据库或者目录数据库,是二次文献数据库,包含文摘数据库、题录数据库、索引数据库、各国的MARC格式的图书目录。 3.2 数据库的构成 由文档、记录、字段构成。 (1)文档(file),若干个逻辑记录构成的信息集合成为文挡。 (2)记录(record),记录是若干个字段组成的文献单元。 (3)字段(field),是文献著录的基本单元,用来描述文献主题内容相关的某种属性。 4.计算机检索中常用的运算符 4.1 逻辑算符 4.1.1 逻辑“与”。用“and”或者“ * ”表示,是用以组配不同的概念逻辑符号,表示“and”连接的两个词在一个记录中必须同时出现。 如:Library and Computer Library Computer 4.1.2 逻辑“或”。用“or”或“+”表示。是用来组配相同或相近概念的逻辑算符,表示在记录中出现其一即可作为命中。如:fiber or fibre fiber fibre 4.1.3 逻辑“非”。在系统中用“not”或者“-”表示,排除某个概念的逻辑算符, 如:Patent not Japan, 表示检中的记录中包含Patent ,不包含Japan。 Patent Japan 4.2 优先算符 优先算符用()表示,在含有多个运算的检索式中,可以用()将需要优先运算的部分括上,系统会优先运算()中的部分,然后在按照not, and, or的顺序进行运算。 如:S (fiber or fibre) and optical 4.3 截词符和屏蔽符 4.3.1. 截词符:用“?”作为截词符,有三种用法。 (1)无限截:在检索词后面加“?”,检出词根相同的、词尾形式任意的词为命中。如:chemic?, 可检出chemic, chemical, chemicalize, chemicallly, chemicophysical, chemiculture。 (2)单复数变化:在检索词后面加“? ?”将检索出单数和复数的形式均作为命中。如:vehicle? ?,会将vehicle和vehicles均为命中。 (3)有限截:在检索词的后面加“??”,表示词尾可以有0~2个字母变化;在检索词后面加“???”,表示词尾可以有0~3个字母的变化。如:S pollut???, 可检索出pollute,polluted, pollution, polluting。 4.3.2 屏蔽符:“?”作为屏蔽符,加在单词中间,可以代表1个字符的变化。如:wom?n, 表示women和woman。词中使用几个屏蔽符,则代表有几个字符的变化。 4.4 位置算符 位置算符是用来规定检索词之间的位置关系的算符: 4.4.1.(w), (nW), 意思是with, 表示它连结的两个词前后位置确定,中间插词不能超过0-n个。 (w)也写作(),实际上是 (0W),表示连接的两个词必须紧密相连,中间不能插词,但是中间可以加连字符。如:S motor (W)lorry, 可以检出motor-lorry和motor lorry。 4.4.2. (N), (nN), 意思是near,表示它连结的两个词前后次序不限,中间可以插入n个词。(N)实际上是(0N),表示连结的两个词中间不得插入其他词。如:S corrosion (N)resis

文档评论(0)

yuzongxu123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档