第二讲 计算机网络信息检索基础(研究生).ppt

第二讲 计算机网络信息检索基础(研究生).ppt

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二讲 计算机网络信息检索基础(研究生)

图书馆信息中心 第二讲 计算机网络信息检索基础 信息检索(Information Retrieval) 信息检索发展过程 手工检索(1876-1954) 脱机批处理检索(1954-1965) 联机检索(1965-1991) 网络化联机检索(1991-今) 传统的联机检索与网络化联机检索比较 数据库的基本概念 数据库的定义 至少由一种文档组成, 能满足特定目的的或特定数据处理系统需要的数据集合。 数据库的类型: (1)参考数据库 书目数据(bibliographic database) 目录数据库(catalog database) 文摘索引数据库(abstract/index database) 指南数据库(directory database) (2)源数据库(source database,data bank) 数值数据库 (numeric database) 文本-数值数据库 (text-numeric database) 属性数据库(property database) 术语数据库 (terminology bank) 全文数据库(full-text database) 图象数据库(graphic database) 多媒体数据库(multimedia database) … 选库的4C原则: 内容 Content 范围 Coverage 时效 Currency 费用 Cost 数据库的结构 字段 存取号字段 基本索引字段 辅助索引字段 记录 文档 顺排文档 倒排文档 计算机信息检索模型 布尔逻辑检索模型(Boolean Model) 向量空间检索模型(Vector Space Model) 概率检索模型(Probabilistic Model) 模糊集合检索模型(Fuzzy-set Model) 扩展布尔逻辑检索模型(Extended Boolean Model) 相关反馈模型(Relevance Feedback Model) 计算机信息检索技术 布尔检索(Boolean Search) 逻辑与 and * 例:solar and energy 逻辑或 or + 例:solar or energy 逻辑非 not - 例:solar not energy 截词检索(Truncation Search) 右截断。截去某个词的后部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来;若输入PY=199?,会把90年代的记录全部查出来。 左截断。截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic,能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。 中间截断。 复合截断。 有限截断。 无限截断。 限制检索(Limitation Search) 字段检索。是把检索词限定在某个(些)字段中,如果记录的相应宇段中含有输入的检索词则为命中记录,否则检索不到。 使用限制符。用表示语种、文献类型、出版国家、出版年代等的宇段标识符来限制检索范围。 使用范围符号。如 Less than,Greater than,From to等。例如,查找 1989年一1999年的文献,可表示为 PY=1989:1999或者 PY=1989 to PY=1999。 使用限制指令。限制指令可以分为;一般限制指令(Limit)和全限制指令(Limit all)。 位置检索(Position Search) (f)算符(Field)。要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如,happiness(f)sadness and crying。 (s)算符(Sub-field/Sentence)。要求被连接的检索词出现在同一句子(同一子段)中,词序不限。例如,machine(s)Plant (n)算符(near)。要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或宇母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1,2,3,…X且词序任意。例如,information(n)retrieval可以检出 information retrieval和retrieval intormation。 (w)

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档