网站大量收购闲置独家精品文档,联系QQ:2885784924

1.信息检索语言的原理.pdf

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索语言的原理 信息检索语言的原理 提纲 一、信息检索语言的控制 二、信息检索语言的概念逻辑 一、信息检索语言的控制 信息检索语言是经过规范化处理的受控语言。 特别是标引信息内容特征的信息检索语言是经过规 范化处理的受控语言。 一、信息检索语言的控制 受控 即对自然语言进行规范处理。 信息检索语言的控制内容包括两个方面: 词汇控制 句法控制 一、信息检索语言的控制 1.检索语言的词汇控制 词汇控制 是指对自然语言中的词汇进行选择、规范并揭示其相关 性的过程。 分类语言和主题语言对词汇控制的要求有所不同,控制程 序也不相同,但两者的词汇处理内容与范围是一致的。 一、信息检索语言的控制 1.检索语言的词汇控制 词汇控制主要包括: 词量控制 词类控制 词形控制 词义控制 词间关系控制 一、信息检索语言的控制 1.检索语言的词汇控制 (1) 词量控制 词量控制 即根据标引与检索的需要,对自然语言进行精选和处理。 • 主要选择各学科与经常出现的,在信息检索中具有一定使用频 率,并能汇集一定信息量的术语,使检索语言词汇其保持在一 定的规模内。 一、信息检索语言的控制 1.检索语言的词汇控制 (2) 词类控制 词类控制 自然语言有多种类型,如名词、动词、形容词、副词、介 词等。 按照对信息内容揭示的要求,检索语言一般只选择名词或 名词性词组(普通名词、专有名词),必要时收入少量形 容词。 一、信息检索语言的控制 1.检索语言的词汇控制 (3) 词形控制 词形控制 主要指对异形同义词进行处理,限定每个概念只用一个语 词形式表达,一个概念只有一个唯一的称谓,一种书面表 达形式。 • 包括对词的不同形体(简繁体)、词的顺序、词的长 度、不同拼写、数字用法、各种符号的用法等规定。 一、信息检索语言的控制 1.检索语言的词汇控制 (4) 词义控制 词义控制 对多义词、同形异义词以及词义含糊不清的一些词进行规范 处理,使其具有明确性和单义性。 • 一般通过在词汇后加限义词或加注的方法予以解决。 一、信息检索语言的控制 1.检索语言的词汇控制 (5) 词间关系控制 词间关系控制 揭示词汇之间的各种关系,使检索语言成为一个完整的术语 语义体系。 检索语言中的词汇都是与其他词汇相关联的,词间关系的揭 示有益于提高标引的准确度,同时便于扩大、缩小和改变检 索范围。 一、信息检索语言的控制 1.检索语言的词汇控制 (5) 词间关系控制 词汇之间的联系主要包括:等同关系、等级关系、相关关系 三种类型。

您可能关注的文档

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8010045112000002

1亿VIP精品文档

相关文档