网站大量收购闲置独家精品文档,联系QQ:2885784924

第2章信息检索原理.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章 信息检索基本原理 2.1 信息检索概述 2.1.1 信息检索的含义与实质 2.1.2 信息检索的类型和特点 2.1.1 信息检索的含义与实质 信息检索是指从任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。因此,完整的信息检索应包括以下两个方面: 1. 信息的标引和存储过程 2. 信息的检索过程 2.1.1 信息检索的含义与实质 广义地讲,信息检索包含信息储存和信息查找两个过程。 狭义地讲,信息检索仅仅指信息查找的过程,即解决特定的信息需求和满足信息用户的需要。 信息检索是指从一定结构的信息储存集合中,查找出用户所需的特定信息的方法与过程。 其实质将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。 示例 高性能聚芳硫醚(PAS)树脂的合成 本课题涉及的提问特征有两个主要的概面 第一概面 聚芳硫醚 涉及的主题词或关键词有: 1.聚芳硫醚 2.聚苯硫醚 3.聚芳硫醚砜 4.聚苯硫醚砜 5.聚芳硫醚酮 6.聚苯硫醚酮 7.聚芳硫醚酰胺 8. 聚苯硫醚酰胺 等 第二概面 合成 涉及的主题词或关键词有: 9.合成 10.制备 11.生产等 提问特征是指从欲检索课题中选择出能代表信息需求的概面以及涉及到的主题词或关键词等。 结论:利用信息的检索系统,查找特指相关信息的过程。 一些基本概念 字段:字段是文献著录的基本单元,反映文献外部特征和内容特征的每一个项目,如题名字段、著者字段、刊名字段、文摘字段、主题词字段、关键词字段等。 一些基本概念 元数据:是一种在电子环境中使用的著录数据。与传统文献中的著录款目性质相同,不同之处在于传统文献的著录是相对完整的、静止的信息内容进行处理。元数据著录的对象,不仅包括图书、期刊、磁带、录像带、缩微品、论文、科技报告,还包括各种形式的网络信息资源等。著录的数据既书目信息、文摘、索引、综述等,也包括文档名、URL等信息源数据。 一些基本概念 记录:是对某一实体属性进行描述的信息单元。每个信息单元由诸如著者、标题、出版日期等若干个数据元组成。在书目数据库中,被描述的实体是某一特定的文献,这类记录通常被称作文献记录。 数字信息检索类型 文献信息检索 数据信息检索 事实信息检索。 数字信息检索类型 (1)文献信息检索 文献信息检索(Document Information Retrieval)是将存储于数据库中关于某一主题文献的线索查找出来的检索。它通常通过目录、索引、文摘等二次文献信息为工具,以原始文献的出处为检索目的,可以向用户提供有关原文献的信息。文献信息检索是利用检索工具查出相关文献的过程。检索系统不直接解答用户提出的问题,而是提供与之相关的文献名称及出处,供用户筛选使用。 数字信息检索类型 (2)数据信息检索 数据信息检索(Data Information Retrieval)是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要查出可回答某一问题的数据的检索。数据信息检索的对象是数值性数据,即具有数量性质并以数值形式表示的量化信息。这些数值型数据各种各样,包括物理性能数据、化学物质数据、环境监测数据、各种统计数据、自然资源数据、经济和社会数据等。数据检索不仅能查出数据,而且能提供一定的运算、推导能力。用户可通过使用经过选择、整理、鉴定的数值数据库检索获得一些量化信息,从而为定量分析提供依据。 数字信息检索类型 (3)事实信息检索 事实信息检索(Fact Information Retrieval) 是将存储于数据库中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它既包含数值数据的检索、运算、推导,也包括事实、概念等的检索、比较、逻辑判断。事实信息检索的对象是已经存在的各种事实的有关资料,它是数值信息和系统数据信息的混合。一般先从系统中检索出所需信息后,再加以逻辑推理才能给出结论。例如MIS数据库中包含大量公司管理中有关人员、工资、销售统计预测、产品规模等信息,这类信息主要是用于管理决策的。事实信息检索比数值数据信息检索复杂。 数字信息检索基本原理 数字信息检索基本原理是将用户的检索提问词与数据库文献记录中的标引词进行比对,当提问词与标引词匹配一致时,即为命中,检索成功。由此可见,能否准确地检索出用户所需的信息,关键在于能否准确地选择检索词。这里所谓的“准确”,是指用户所选用的检索词必须与数据库中标引文献记录所用的标引词相一致。 检索语言就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用

文档评论(0)

jdy261842 + 关注
实名认证
内容提供者

分享好文档!

1亿VIP精品文档

相关文档