- 1、本文档共48页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章信息检索讲解
第六章 信息检索 信息组织是指按照一定的规则来描述信息资源 或信息对象,以便于能被需要它们的人高效地利用。 信息检索则是指为了个人或他人的需要,去发现适当的信息资源或信息对象。 信息组织和信息检索是一对互逆过程。 6.1 信息检索的基本概念与原理 6.1.1信息检索的涵义 根据特定的需求,运用某种检索工具, 按照一定的方法,从大量文献中查出所 需的资料或信息的过程。 满足信息用户的信息需求而建立的,存贮经过加工了的信息集合,拥有特定的存贮、检索与传送的技术装备,提供一定存贮与检索方法及检索服务功能的一种相对独立的服务实体(包括人和检索工作单位),统称为信息检索系统(Information Retrieval System,简称IRS)。 信息检索系统的三个基本要素:人、检索工具(包括设备)和信息资料 信息检索系统的体系结构 6.1.2 信息检索的类型与特性 手工检索工具主要指,如印刷版的《全国报刊索引》。 计算机检索系统 主要指,如《中国期刊全文数据库 》 数据信息和事实信息检索是确定性的检索,检索结果可以直接利用。 文献信息检索是一种相关性检索,检索结果是文献信息的线索,一般通过二次信息来实现。 全文数据库:是一次信息和二次信息的综合体。在检索结果中,有直接的全文链接。 特性: 信息检索的相关性 相关性表明用户是否认为一文献与一提问吻合。 信息检索的不确定性 标引的不确定性是指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词,即标引词选用的不一致性。检索词选用的不确定性是指候选检索词集不止一个,检索过程具有试探性。 信息检索的逻辑性 检索语言、检索策略(处理信息检索提问的逻辑与查找步骤的科学安排) 6.1.3信息检索的模型 布尔逻辑检索模型 (BooleanRetrieval Model,简称BRM) 概率检索模型(Probability Retrieval Model,简称PRM) 向量空间检索模型(Vector Retrieval Model,简称VRM) 模糊检索模型 (Fuzzy Retrieval Model,简称FRM) 6.2 信息检索的职能与程序 6.2.1 信息检索语言的职能 信息检索语言是根据信息检索需要创制的一种人工语言,又称检索语言、信息存贮与检索语言、文献工作语言、索引语言、标引语言、信息检索标识、标识系统等等。 信息检索语言:词汇和语法 信息检索语言的职能: 可以表示文献内容、数据或其他信息形式 有专用概念表示用户的信息提问 能够指示计算机执行查询与检索 6.2.2 信息检索策略 信息检索策略是针对检索提问、运用检索方法和技术而设计的信息检索方案,其目的是要达到一定的检准率和检全率。 常用信息检索策略包括:分块概念组配检索策略、逐步组配检索策略、对偶组配检索策略、增长组配检索策略等。 目前在以下三方面取得进展: (1)以检全为目标的检索策略的调节与控制; (2)以检准为目标的检索策略的调节与控制; (3)以最小投入为目标的检索策略的调节与控制。 对特定系统、特定数据以及某一类型课题的检索策略的研究具体表现在以下两方面: (1)某一系统、某一数据库检索策略; (2)某一类型课题检索策略。 6.2.3 信息检索效率的评价 检索效率是指全、准、快、便、省(检全率、检准率、检索速度、检索方便性、检索成本与效益),最主要的是全和准。 在评价信息检索效率过程中,主要通过检全率、检准率、漏检率和误检率四个评价指标进行评价,其中重点是检全率和检准率。 检全率=检出的相关文献量/系统中的相关文献总量 检准率=检出的相关文献量/检出的文献总量 漏检率=未检出的相关文献量/系统中的相关文献总量 误检率=检出的非相关文献量/检出的文献总量 检全率与检准率的互逆相互曲线 6.2.4 信息检索的程序 (1)分析检索课题,明确信息需求 明确信息检索课题所涉及的领域和范围; 明确所需信息的内容及其内容特征; 明确所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及的语种、有关著者及机构等; 明确信息检索课题对查新、查准和查全的指标要求。 (2)选择检索工具,了解检索系统 信息检索工具是人们为了充分、准确、有效 地利用已有的信息资源而加工编制的用来报道、 揭示、存贮和查找信息资源的卡片、表册、计算 机信息系统和特定出版物。 (3)确定检索途经,选定检索方法 (4)实施检索策略,浏览初步结果 在获取信息线索时要仔细阅读,判断所检出的 信息是否符合检索的要求,不仅看篇名,还要阅读 整个著录格式,进行综合分析。
您可能关注的文档
最近下载
- 期末默写、文言基础复习 统编版高中语文必修上册.docx VIP
- 对水果产业发展的调研报告.pdf
- 海水提取氯化钾项目节能评估报告.docx VIP
- 【一诊】绵阳市高三2022级(2025届)第一次诊断性考试数学试卷(含答案逐题解析).docx
- 2023-2024学年天津市河北区八年级第一学期期中数学试卷及参考答案完整版.pdf VIP
- 海水提取氯化钾项目节能分析报告.docx VIP
- 地基承载力标准值、特征值、允许值辨析.pdf
- 山东省烟台市2023至2024学年高二上学期期中考试化学试题附参考答案(解析).docx
- 利用PDCA降低乳腺癌改良根治术后患肢功能障碍发生率【24页】.pptx
- 高中英语课件:The Face-down Generation.pptx
文档评论(0)