第五讲 计算机信息检索.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五讲 计算机信息检索

联系电话:0833-2276287 E-mail:yyuuttll@263.net 2004年2月 第六讲 计算机信息检索 第一节 计算机信息检索概述 第二节 计算机信息检索功能和检索途径 第一节 计算机信息检索概述 一、计算机信息检索的发展及其意义 二、数据库及其结构 计算机信息检索的发展及其意义 二、数据库及其结构 数据库(Date Base)是“至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合” 1、计算机文献数据库的基本构成: 数据库的树状结构图 2、数据库的类型 参考数据库(Reference Databases) 题名数据库( Superscription Databases) 指南数据库(Dictionary Databases) 源数据库 (Source Databases) 数值数据库(Numeric Databases) 全文数据库(Complete Text Databases) 文本—数值数据库(Textural Numeric Database) 属性数据库(Proterties Databases) 3、数据库的索引 数据库的索引是数据库为所有可检索字段建立的文挡。 有多少个可检索字段,就有多少个索引。 通过查阅数据库索引,可以了解数据库收录文献的各种情况。 数据库的检索索引一般分成基本索引和辅助索引两部分。 第二节 计算机信息检索功能和检索途径 一、计算机检索的匹配运算 二、检索途径与检索策略的制定 一、计算机检索的匹配运算 匹配运算——将文献的特征标识(索引词)与检索提问标识(检索词)进行匹配,达到字面上的一致。 匹配运算按照匹配方式可分为:逻辑组配检索,通配检索,原文检索,加权检索和聚类检索,扩检与缩检等。 逻辑组配检索(布尔检索) 布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。 布尔逻辑组配方式主要有: 逻辑“与” And或* 截词检索(通配检索) 截词检索是指用截断的词进行检索,凡符合截断词的所有字符的文献都为命中文献。 截词方式有:右截(前方一致)、左截(后方一致)及左右截(中间一致)三种,截词符号通常为“?”、“*”、此外还有屏蔽检索等方法。 可以起到扩大检索范围,提高查全率,减少检索词的输入量等作用。检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。 原文检索 原文检索是一种不依赖叙词表而直接使用自由词的检索方法。 原文检索可以弥补布尔逻辑检索、截词方法检索的一些不足,增强选词的灵活性,从而提高检索的查全率。 加权检索和聚类检索 是指对于n个检索词,按其重要性分别赋予一定的权值,并指定各检索词的权值之和,至少应达到某个临界值,检索到的文献才算命中。 运用加权检索可以命中核心概念文献,因此它是一种缩小检索范围提高检准率的有效方法。 不是所有系统都能提供加权检索这种检索技术,而能提供加权检索的系统,对权的定义、加权方式、权值计算和检索结果的判定等方面,又有不同的技术规范。 扩检与缩检 扩检是指初始设定的检索范围太小,命中文献不多,需要扩大检索范围的方法。扩检的方法主要可以有以下几种: 概念的扩大;范围的扩大;增加同义词;年代的扩大。 二、检索途径与检索策略的制定 文献外部特征的检索途径 分析检索课题 主要应搞清楚检索课题所涉及的学科、专业范围,所需要的信息类型是文献、还是具体的数据、事实? 选择数据库 要根据检索课题的内容范围和要求来选择数据库,其内容主要包括: (1) 数据库的类型是否满足检索需要。 (2) 数据库的学科专业范围是否相吻合。 (3) 数据库收录的文献类型、文献存贮年限、更新周 期是否符合检索需求。 (4) 数据库对文献的描述程度、标引深度、专指度如 何等,是否按标准化著录。 (5) 数据库提供的检索入口是否与检索课题的已知线 索相对应。 课题概念分析 课题概念分析就是要弄清检索课题已知什么、查找什么,确定有关的主题、人物、事件、时间、字词、等因素。 提取检索词 确定检索词的基本准则: 1、必须能正确反映检索要求; 2、必须符合数据库的检索用词规则; 3、优先选用具有检索意义学科名词术语; 4、多选常用的基本词汇进行组配。 检索策略是实现检索目标而制定的方案,是对整个检索过程的谋划。具体包括: 1.确定查找范围 2.选择检索手段 3.确定检索途径 编制检索式

文档评论(0)

qwd513620855 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档