第二课 12 9 25.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二课 12 9 25

标题词语言(subject heading) 主题检索语言中最早出现的一种语言。 标题词:从自然语言中选取并经过规范化处理的、表示事物概念的的词、词组或短语。 代表:EI中《工程主题词表》(简称SHE) 电脑---见(see)---计算机 局域网---参见(see also)---计算机网络 一种先组式的规范词语言,即在检索前已经将概念之间的关系组配好。 具有较好的通用性、直接性和专指性,但灵活性较差。 常用的标题词表有《美国国会标题词表》(Library of Congress Subject)、《医学主题词表》(Medical Subject Headings)。 同义规范 :学名与俗称、新称与旧称、全称与简称 、不同译名 等 词义规范 :一是范围注释,即对同一主题词在不同学科领域或在不同语言环境下所具有的不同概念进行注释, 二是含义注释,即对在某些概念上混淆不清的主题词做简明扼要的说明,用来明确其含义和用法。 词类规范 :标题词选定范围 关键词语言(keyword) 从文献中直接选取,未经规范,用以标引和检索文献信息的词语。关键词又称自由词,属自然语言范畴。 用词的自由性是关键词与标题词、叙词等人工语言词语的最大区别之处。 所用的标引词直接取自文献本身,如从文献的题名、文摘和正文中选词。除了禁用词(stop-term),如冠词、介词、副词、连接词等语法词外,几乎所有具有实际意义的词都可以用作标引词。由于标引词来自文献本身,故关键词语言属于自然语言。 自然语言,基本上未经过规范化处理,多义性、同义性、模糊性,检索用词无法一一对应,会造成文献信息的漏检和误检。 简便易用,成为网络环境下的信息检索最主要的检索语言。 ①用同义词标引导致漏检。如“天线”的常用英文标引词有“antennas”和“aerials”。若想查全避免漏检,则需将所有表达“天线”的词汇作为同义词进行检索; ②多义词标引导致误检。如多义词cell既可表示“细胞”,也可表示“电池”。当用cell一词查找有关细胞方面的文献时,检出的电池类文献即为识检。 单元词语言(uniterm) 又称元词,是指从文献中抽取出来的,能表达文献主题内容,不能再分解的概念单元的规范化词。 如“信息检索”是一个词组,“信息”和“检索”才是单元词 由于单元词法是字面组配,所以尚不够严谨,时常会出现组配错误的情况。目前,这种方法已被叙词语言所取代。 叙词语言(descriptor) 以叙词作为信息单元主题标识和检索的主题语言 叙词又称描述词或叙述词,是指从信息的内容中抽出的,以概念为基础,经过优化和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需求的名词或术语。 包含多个主题的文献可以用多个叙词进行标引。在检索时可由多个叙词形成任意合乎逻辑的组配,构成多种组合方式。如有关汽车发动机制造方面的文献,可用汽车、发动机、制造三个叙词来标引。叙词的这一优点很适合于计算机检索。 * 叙词表(thesaurus):由叙词按一定的规则编制而成的词表。它是对文献进行主题标引的依据。 1959年美国杜邦公司编制了第一部叙词表,其后,随着计算机的应用,叙词表的编制迅速发展,叙词语言成为受控信息组织和检索的主要语言。 国内外叙词表的数量不下千种,我国叙词表已超130多种 常见的叙词表:《汉语主题词表》、《中国分类主题词表》、《教育分面叙词表》、英国《科学文摘》的《INSPEC叙词表》、《EI Thesaurus 叙词表》、美国《政府报告和索引》的《NTIS叙词表》、《ASM冶金词表》等。 叙词表成为规范各学科或某一专业领域名词术语的工具 概念组配是叙词语言的基本原理。 概念组配与字面组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合(拆词);概念组配是概念的分析与综合(拆义)。例如: 字面组配 模拟+控制--模拟控制 香蕉+苹果--香蕉苹果 概念组配 模拟+控制--模拟控制 香蕉味食品+苹果--香蕉苹果 * 叙词词表中的关联关系 Y (用)USE 指引正式主题词 D(代)UF 指引非正式主题词 S(属)BT 指引上位主题词 F(分)NT 指引下位主题词 C(参)RT 指引相关主题词 Z(族)CC 指引族首主题词 (最上位词) 参照系统揭示主题词之间关系 《汉语主题词表》是我国第一部大型的综合性叙词表,1980年正式出版,主表分为社会科学、自然科学和附表3卷。全

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档