第二章信息检索语言.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章信息检索语言.ppt

第二章 信息检索语言 检索语言概述 主题检索语言 分类检索语言 一、检索语言概述 1.信息检索语言的基本功用 信息检索语言是根据信息检索需求所使用的一种专门的人工语言,这种人工语言是在自然语言基础上形成的,能够描述和组织信息特征的一种语言。 表达信息 组织信息 2.检索语言的组成要素 字符 基本词汇 语法规则 3.检索语言的特点:严密性、可控性、系统性 4.检索语言的类型 内容特征语言 分类语言 主题语言 外部特征语言 名称语言 著者语言 序号语言 二、主题语言 1.概念: 主题:指文献论述的对象,包括事物、问题、现象等。 主题词:用来表达文献主题的词语。 主题语言:是以自然语言中语词文字为基础,以反映特定事物为中心,以主题词字顺为基本结构的一种检索语言。 2.主题语言特点: 集中性、直观性、灵活性、组配性 3.类型: 标题词语言; 单元词语言; 叙词语言; 关键词语言 标题词语言 标题词:是指经过规范化处理的用来标引文献的词或词组,通常是比较定型的事物名称。 标题词语言:以标题词作为文献主题标识,以词表预先确定的组配方式标引和检索的主题语言。 常见的标题形式: 单词标题 词组标题 倒置标题 复分标题 带限定词的标题 标题词语言的优点: 采用列举式词表,形式直观 定组式标题结构固定,含义明确 按照词表列举的标题和副标题进行标引,操作简便 标题词语言的缺点: 采用列举式词表,收词量巨大、修订量大、专指度相对不足 大量采用定组式标题,无法实现多元检索 单元词语言 单元词: 又称元词,是指用来标引文献主题的、最基本的、字面上不能再分的词语。 单元词语言: 以元词作为文献主题的标识,通过字面组 配的 方式表达文献主题的主题语言。 优点:元词法词表体积小、标引专指度高,便于从不同主题词角度检索 缺点:直接性差;不适宜查找论述基本主题的文献;字面组配。 叙词语言 叙词:经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。 叙词语言:从自然语言中精选出来的、经过严格处理的词语作为文献主题标识,通过概念组配方式表达文献主题的检索语言。 优点: 组配准确,标引能力强;结构完备,词汇控制严格 适合多途径检索,检索效率高;对检索系统的适应性高 缺点: 词表编制和管理的难度大;标引难度大。 叙词语言的词汇控制 词量控制 词类控制 词形控制 词义控制 词间关系控制 先组度控制 关键词语言 关键词:是指从文献信息的题名、摘要或正文中抽取出来能揭示信息内容特征的词语。 关键词语言:是直接以关键词作为文献主题标识,通过关键词轮排的方式揭示文献的主题一种语言。 关键词语言的原理: 直接抽取文献中或题名中的词语作标识,对作为标识的词语不加规范或只作极少量的规范处理 编制禁用词表来控制抽词,不编制受控词表来进行词汇控制,不显示词间关系 按关键词 字顺轮排,提供多途径的主题字顺检索 关键词索引的类型: 题内关键词索引;题外关键词索引;双重关键词索引 单纯关键词索引;词对式关键词索引;简单关键词索引 题内关键词索引( Keyword in context index) 也称上下文关键词索引,其款目格式是: 上文 关键词 下文 文献地址 题外关键词索引( Keyword out of context index) 关键词 篇名 文献地址 双重关键词索引 ( Double KWIC index) 第一关键词 第二关键词 /上下文 文献地址 通过两个关键词的组配进行查找,有助于提高查准率;但索引篇幅庞大,实用性较差。 单纯关键词索引: 索引款目纯粹由多个关键词组成,不包括非关键词,由关键词轮排及文献地址组成 词对式关键词索引: 每次只取文献多个关键词中的两个配对构成索引款目并轮排 的关键词索引 简单关键词索引: 索引款目只有一个关键词,每个关键词后有许多个文摘号 关键词语言的优点: 简捷性 易用性 及时性 查准率高 关键词语言的缺点; 关键词未经规范处理,影响查全率 文献题名的质量影响用关键词语言编制的检索工具 机械抽词造成在关键词索引款目中出现大量冗余的索引款目 三、分类语言 亦称体系分类语言,是以学科范畴和学科体系为基础来划分事物的一种检索语言。在信息存储和检索中,它是一种对信息内容的概念进行逻辑分类和有规律地系统排列而构成的检索语言,并以分类表(分类法)的形式体现。 分类语言最显明的特点是系统性,具有族性检索的功能,有利于人们从学科专业的角度进

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档