- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3.3.1 检 索 技 术 * 第4章 计算机信息检索 * 4、字段限制 适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合。 如:篇名、作者、 刊名、主题词等字段 3.3.1 检 索 技 术 5 截词法 适用于西文检索,可以检索出同一词干开 头、词义相近的检索词,扩大检索范围。 截词符也称通配符,一般有: “ * ”、“ ? ”等 各个数据库有不同的表示法。 一般有后截词、前截词、中间截词三种. * 第4章 计算机信息检索 * 后 截 词 分有限和无限二种。 无限截词:词干后紧接一个截词符; 有限截词:词干后紧接二个以上截词符; 注:二个截词符即截二个字母,三个截词 符即截三个字母,以此类推。 * 第4章 计算机信息检索 * 例如: 在EI数据库中输入检索词:computer* (无限截词) 可以检索出以computer词干开头、后面变化无数位(当然也包括词干本身)的词,如:包含computer、computers、computerizd、computerise的记录。 * 第4章 计算机信息检索 * 前截断*(左截断): 后方一致,查找检索词前缀有变化的词。 中截断?(中间屏蔽): 前后一致,查找检索词中间有变化的词。 * 第4章 计算机信息检索 * 使用截词需注意四个问题 一是截词符要紧接在词干后面,截词符和词干之间不能有空格。 二是避免将检索词的词干截得过短,一般应在三个字母以上。 三是截词应该合理使用。一般不可能出现词尾变化的单词其后不必再使用截词。 四是从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率。 * 第4章 计算机信息检索 * 3.3.1 检 索 技 术 6、词组检索 一般数据库词组算符为双引号,在EI数据库中,有三种方式: “ ”、 { }、 onear/0 * 第4章 计算机信息检索 * 3.3.1 检 索 技 术 7、禁用词 不能用作检索的虚词,如:介词、连词、冠词等. An, And, By, For, From, Of , The,To, With等. * 第4章 计算机信息检索 * 3.3.2 检索概念分析提取方法 1、一般的课题概念分析方法 提取主要概念,并能用若干个词或词组 表示,并弄清概念之间的关系。 例1: 甜味剂的过敏反应 主要概念:甜味剂 过敏反应 例2:聚乙烯的合成 主要概念:聚乙烯 辅助概念:合成 * 第4章 计算机信息检索 * 3.3.2 检索概念分析提取方法 2 、核心概念的选取 有些检索词中已经含有的某些概念,在概念分析中应予以排除. 例1: 玻璃纤维增强石膏制品 核心概念:玻璃纤维 石膏制品 * 第4章 计算机信息检索 * 3.3.2 检索概念分析提取方法 3、有些检索概念已经体现在所使用的数据库中,这些概念也应予以排除. 例: 在计算机应用文献数据库中查资料就 可省却“计算机”这个检索概念。 * 第4章 计算机信息检索 * 3.3.2 检索概念分析提取方法 4、比较泛指、检索意义不大的概念,应 予以排除。 例如:“发展”、“趋势”、“现状”、“应用”、 “提高”、“利用”等 例1:只读光盘的研制与开发? 核心概念:只读光盘 例2:高性能激光放大器 核心概念:激光 放大器 * 第4章 计算机信息检索 * 3.3.2 检索词的扩展 基于同一概念(同物异名)检索词的扩展法 (1) 寻找同一事物的学名和俗名、商品名和代号等 如:贸易与商业;便携式录音机和walkman; 涉外与对外;刊物与杂志; (2) 寻找同一事物的简称、全称、音译和意译等 如:外语与外国语言;world wide web与WWW; 互联网与因特网;逻辑代数与布尔代数; 科技与科学技术;培养与教育; * 第4章 计算机信息检索 * * 第4章 计算机信息检索 * (3) 寻找同一事物名称的近义词和反义词 如:教学与培训、教育,研究与分析、比较、理论、变化,翻译与直译、意译,美术与艺术,英汉与汉英,否定与肯定 (4) 如果是英语,寻找同一事物名词的单复数、不同词性、英美语的不同形式 如:network与networks、networking、networked, fiber 与fibre 3.3.2 检索词的扩展 * 第4章 计算机信息检索 * 基于内容分析的概念
您可能关注的文档
- 文秘实务与案例第二版作者张勇第二章节办公室日常事务管理课案(2380KB).ppt
- 第3章节热二律课件(2466KB).ppt
- 第3章节人力资源战略1课件(1089KB).ppt
- 第3章节人体感知与运动系统课件(5871KB).ppt
- 第3部分23中国的河流和湖泊课件(1064KB).ppt
- 第3部分古诗文阅读第二十二讲古诗词鉴赏(2553KB).ppt
- 文秘实务与案例第二版作者张勇第三章节接待工作课案(1319KB).ppt
- 文秘实务与案例第二版作者张勇第四章节一般会议的组织课案(1164KB).ppt
- 第3部分古诗文阅读第二十三讲文言文阅读一(2221KB).ppt
- 文秘实务与案例第二版作者张勇第一章节办公环境管理课案(1080KB).ppt
文档评论(0)