- 1、本文档共45页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索原理
第2章 信息检索基本原理 2.1 信息检索概述 2.1.1 信息检索的含义与实质 2.1.2 信息检索的类型和特点 2.1.1 信息检索的含义与实质 信息检索是指从任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。因此,完整的信息检索应包括以下两个方面: 1. 信息的标引和存储过程 2. 信息的检索过程 2.1.1 信息检索的含义与实质 广义地讲,信息检索包含信息储存和信息查找两个过程。 狭义地讲,信息检索仅仅指信息查找的过程,即解决特定的信息需求和满足信息用户的需要。 信息检索是指从一定结构的信息储存集合中,查找出用户所需的特定信息的方法与过程。 其实质将描述特定用户所需信息的提问特征,与信息存储的检索标识进行异同的比较,从中找出与提问特征一致或基本一致的信息。 示例 高性能聚芳硫醚(PAS)树脂的合成 本课题涉及的提问特征有两个主要的概面 第一概面 聚芳硫醚 涉及的主题词或关键词有: 1.聚芳硫醚 2.聚苯硫醚 3.聚芳硫醚砜 4.聚苯硫醚砜 5.聚芳硫醚酮 6.聚苯硫醚酮 7.聚芳硫醚酰胺 8. 聚苯硫醚酰胺 等 第二概面 合成 涉及的主题词或关键词有: 9.合成 10.制备 11.生产等 提问特征是指从欲检索课题中选择出能代表信息需求的概面以及涉及到的主题词或关键词等。 结论:利用信息的检索系统,查找特指相关信息的过程。 一些基本概念 字段:字段是文献著录的基本单元,反映文献外部特征和内容特征的每一个项目,如题名字段、著者字段、刊名字段、文摘字段、主题词字段、关键词字段等。 一些基本概念 元数据:是一种在电子环境中使用的著录数据。与传统文献中的著录款目性质相同,不同之处在于传统文献的著录是相对完整的、静止的信息内容进行处理。元数据著录的对象,不仅包括图书、期刊、磁带、录像带、缩微品、论文、科技报告,还包括各种形式的网络信息资源等。著录的数据既书目信息、文摘、索引、综述等,也包括文档名、URL等信息源数据。 一些基本概念 记录:是对某一实体属性进行描述的信息单元。每个信息单元由诸如著者、标题、出版日期等若干个数据元组成。在书目数据库中,被描述的实体是某一特定的文献,这类记录通常被称作文献记录。 数字信息检索类型 文献信息检索 数据信息检索 事实信息检索。 数字信息检索类型 (1)文献信息检索 文献信息检索(Document Information Retrieval)是将存储于数据库中关于某一主题文献的线索查找出来的检索。它通常通过目录、索引、文摘等二次文献信息为工具,以原始文献的出处为检索目的,可以向用户提供有关原文献的信息。文献信息检索是利用检索工具查出相关文献的过程。检索系统不直接解答用户提出的问题,而是提供与之相关的文献名称及出处,供用户筛选使用。 数字信息检索类型 (2)数据信息检索 数据信息检索(Data Information Retrieval)是将经过选择、整理、鉴定的数值数据存入数据库中,根据需要查出可回答某一问题的数据的检索。数据信息检索的对象是数值性数据,即具有数量性质并以数值形式表示的量化信息。这些数值型数据各种各样,包括物理性能数据、化学物质数据、环境监测数据、各种统计数据、自然资源数据、经济和社会数据等。数据检索不仅能查出数据,而且能提供一定的运算、推导能力。用户可通过使用经过选择、整理、鉴定的数值数据库检索获得一些量化信息,从而为定量分析提供依据。 数字信息检索类型 (3)事实信息检索 事实信息检索(Fact Information Retrieval) 是将存储于数据库中的关于某一事件发生的时间、地点、经过等信息查找出来的检索。它既包含数值数据的检索、运算、推导,也包括事实、概念等的检索、比较、逻辑判断。事实信息检索的对象是已经存在的各种事实的有关资料,它是数值信息和系统数据信息的混合。一般先从系统中检索出所需信息后,再加以逻辑推理才能给出结论。例如MIS数据库中包含大量公司管理中有关人员、工资、销售统计预测、产品规模等信息,这类信息主要是用于管理决策的。事实信息检索比数值数据信息检索复杂。 数字信息检索基本原理 数字信息检索基本原理是将用户的检索提问词与数据库文献记录中的标引词进行比对,当提问词与标引词匹配一致时,即为命中,检索成功。由此可见,能否准确地检索出用户所需的信息,关键在于能否准确地选择检索词。这里所谓的“准确”,是指用户所选用的检索词必须与数据库中标引文献记录所用的标引词相一致。 检索语言就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用
您可能关注的文档
- 险理赔流程.doc
- 险的分类.doc
- 险精算基本概念讲解.ppt
- 险的有关案例.doc
- .保险监管.ppt
- 险经纪和保险代理区别.docx
- 险考试.doc
- 险经济人.doc
- 险考试试卷.doc
- .保险的定义及体现的经济关系.doc
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
最近下载
- 广东梅州市嘉城建设集团有限公司招聘笔试题库2025.pdf
- 危险化学品的分类和品种目录.docx VIP
- 2024辽宁农业科学院所属事业单位招聘30人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 《电子CAD技术》教学课件:第4章 印制电路板设计基础.ppt VIP
- 老年患者临床营养管理服务规范--公布版2022.5.2.(1).pdf VIP
- 2019人教版小学六年级数学上册全册教案.docx VIP
- 高维之境:图模型与多变点检测的统计推断新探.docx
- 广东嘉城建设集团有限公司及其下属公司招聘笔试题库2025.pdf
- 河北省生产经营单位安全培训教育档案(最新版-冀应急人(2019)50号).docx VIP
- 加强医德医风建设的重要性.docx
文档评论(0)