第4章信息检索技术”.pptVIP

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章信息检索技术”

图书馆信息化建设 杨思洛 图书馆信息化建设 第一编 图书馆信息化基础 第二编 图书馆自动化系统 第三编 数字图书馆理论与相关技术 第一编 图书馆信息化基础 第一章 图书馆信息化建设概述 第二章 图书馆信息资源规划与建设 第三章 信息系统的分析与设计 第四章 信息检索技术 第五章 图书馆与互联网 第六章 图书馆信息化建设的硬件环境 第四章 信息检索技术 第一节 计算机检索系统原理和构成 第二节 信息组织与存贮技术 第三节 信息检索技术 第四节 文档检索技术 第五节 Internet 信息检索工具 第一节 计算机检索系统原理和构成 一、计算机检索的基本原理 计算机检索是指利用计算机存储和检索信息。具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。 计算机信息检索广义上讲包括信息的存储和检索两个方面。 第一节 计算机检索系统原理和构成 二、计算机信息检索系统的组成 (一) 计算机硬件、软件 (二) 通信网络 (三) 检索终端设备 (四) 数据库 第二节 信息组织与存贮技术 一、数据库定义和类型 1、数据库的定义 将信息标引、著录后形成的信息记录,按一定格式依次录入计算机,并存储在磁带或磁盘上,形成供计算机检索用的数据库。数据库是被收集在一起的一组有序的信息单元,每个信息单元由若干个独立的结构单元组成,数据元存储在字段中,每个数据元描述信息单元的一个特性。 第二节 信息组织与存贮技术 2、数据库的类型 按数据库所含信息的内容可以划分为以下类型: (1)文献书目数据库(Bibliographic Databases) (2)信息指南数据库(Dictionary Databases) (3)数值型数据库(Numeric Databases) (4)全文数据库(Complete Text Databases 第二节 信息组织与存贮技术 二、数据库编排结构 所谓数据库的编排结构,就是计算机检索系统中数据库的每条记录数据项的编排方式,有顺排文档和倒排文档两种。 (1)顺排文档 (2)倒排文档 第三节 信息检索技术 1、布尔逻辑检索 (1)逻辑“与” (2)逻辑“或” (3)逻辑“非” 第三节 信息检索技术 2、位置检索 位置检索也叫全文检索、邻近检索。所谓全文检索,就是利用记录中的自然语言进行检索, 词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。 第三节 信息检索技术 3、截词检索 (1)后方截词 (2)中间截词 (3)前言截词 4、字段限定检索 字段限定检索是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法 第四节 文档检索技术 当提问逻辑式列出并输入到计算机后,经计算机检索系统自动检验,确认无误时,才开始检索。实现检索的途径主要采用顺排文档与倒排文档检索。 第四节 文档检索技术 一、顺排文档检索技术 顺排文档是指按文献的输入顺序依次存贮的文档。顺排文档检索就是按顺序对数据库中每条记录进行查找。 第四节 文档检索技术 其检索过程如下: (1)将用户提问逻辑式输入计算机,建立用户提问档,系统将提问档转换为提问展开表。 (2)对每一条文献记录编制检索标识表。 (3)将提问展开表与检索标识表进行比较。 (4)输出命中结果。 顺排文档检索技术 1、提问展开表的建立 2、检索标识表 3、提问展开表与检索标识表的比较方法4、顺排文档检索流程 5、批量提问检索 第四节 文档检索技术 二、倒排文档检索技术 倒排文档是由检索词和与其对应的原文献地址组成的索引文档。对倒排文档检索时,首先从倒排文档中检索出有关的文献号集合,进行逻辑运算,得出结果,然后根据结果文献号集合从主文档中读出命中文献的全部信息。 倒排文档检索技术 1.倒排文档的建立 2、提问逻式的“逆波兰表示法” 3、操作指令表的建立 4、检索过程 第五节 Internet 信息检索工具 ——搜索引擎 一、搜索引擎的基本概念 二、搜索引擎的种类 三、搜索引擎的一般查询规则 四、主要的搜索引擎选介 一、搜索引擎的基本概念 1、搜索引擎的定义 搜索引擎是一种能够通过Internet 接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统 2、搜索引擎的工作原理 搜索引擎包括信息搜集、信息处理和信息查询三部分: (1) 信息搜集(2) 信息处理 (3) 信息查询 二、搜索引擎的种类 1、按工作语种

文档评论(0)

185****7617 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档