- 1、本文档共79页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《计算机基础》-第8章 信息检索
第8章 信息检索 8.1 信息检索 1、信息检索基本理论 (1)文献:是记录有知识的一切载体的总和。包括载体与知识两部分。 远古时期的结绳记事:绳子+每个结表示的含义; 甲骨文时期:大动物的骨头、龟壳+记录的内容; 竹简时期:竹子+记录的内容; 纸张时代:书、手稿等+记录的内容; 现代:音像制品、电子出版物等+记录的内容。 (2) 信息:从客观上说,信息是指一切事物存在方式和运动规律的表征,或我们对周围 世界的一种认识。有正确与错误之分。 (3)信息检索:信息检索是指将杂乱无序的信息有序化形成信息集合,并根据需要从信息集合中查找出特定信息的过程。 (4)信息检索系统: 任何具有信息存储与检索功能的系统,均可以称之为信息检索系统。从狭义上讲,信息检索系统可以理解为一种可以向用户提供信息检索服务的系统。 8.2 检索系统的类型 1. 检索系统按照检索的功能划分可分为: 书目检索系统 事实数据检索系统 2. 检索系统按照检索的手段划分可分为: 手工检索系统 计算机检索系统 计算机检索系统由计算机硬件、检索软件、数据库及通信网络等组成。 硬件主要包括:中心计算机、检索终端及数据输出设备等; 检索软件是检索系统的灵魂,负责管理数据库和处理检索提问,它决定系统的检索能力; 数据库是检索系统的信息源,是检索作业的对象; 通信网络是信息传递的设施,其主要作用是在检索终端和中心计算机之间进行信息传递。 8.2 检索系统的类型 3. 常用信息检索系统类型: 8.3 网络检索系统 1. 用户如何在网络上找到信息? 解决之道:搜索引擎 2. 搜索引擎的分类: 目录(Directory,或 Catalog); 基于Robot的搜索引擎; 元搜索引擎 (用得较少)。 8.3.1 目录 目录:目录方式所使用的数据库是依靠专职编辑或志愿人员建立起来的。 目录的用户界面基本上都是分级结构。有两种使用方式: 由开始几个大类入口→逐级向下访问→ 找到自己感兴趣的类别。 利用目录提供的搜索功能直接查找一个关键词。 8.3 网络检索系统 优点:比较精确。由于目录依靠人工来评价一个网站的内容,因此用户从目录搜 索得到的结果往往比从其它的搜索引擎得到的结果更具参考价值。 缺点:有一定时延。只能在已经保存的站点特性描述数据库中进行搜索,因此站点本身的动态变化可能不会及时反映到特性描述数据库中。 8.3.2 基于Robot的搜索引擎 Robot:一个能够沿着链接漫游整个Web集合的程序。 特点:需要定期访问大多数以前搜集的网页,刷新索引,以反映出网页的更新情况,并去除一些无效链接。 代表:天网,Google 8.3 网络检索系统 8.3.3 元搜索引擎 元搜索引擎(Meta-search Engine):是一种调用其他独立搜索引擎的引擎。“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。 元搜索引擎是用户同时利用多个引擎进行网络信息搜索的中介。 检索时,元搜索引擎整理用户提交的检索请求,调用多个独立搜索引擎进行搜索,优化搜索结果,统一显示。 8.4 检索意愿的表达 8.4.1 布尔检索 1. 常用检索技术 用得多:布尔检索、词位检索 用得少:截词检索、限制检索 注:并不是每个检索系统都支持所有的检索技术。 2. 布尔检索 布尔运算符:AND、OR、NOT 8.4 检索意愿的表达 (1) AND 逻辑与是一种具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示。 使用“逻辑与”组配技术,缩小了检索范围,增强了检索的专指性,可提高检索信息的查准率。 例:“打印机驱动程序” 查询关键词:打印机、驱动程序 检索表达式:打印机 AND 驱动程序 (2) OR 逻辑或是一种具有并列关系概念的组配,用“+”或“OR”算符表示。 使用“逻辑或”检索技术,扩大了检索范围,能提高检索信息的查全率。 检索“微型计算机”方面的有关信息 查询关键词:微型计算机、微机 检索表达式:微型计算机OR 微机 8.4 检索意愿的表达 (3) N
文档评论(0)