- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文献检索语言与索引
5、文献检索语言与索引1 文献检索语言 信息检索的过程实质上就是把检索提问与检索标识进行比较并决定取舍的过程。为了使这个过程顺利实现,检索提问与检索标识都要用一定的语言来表达,借助于这种语言,检索者和标引员才能彼此沟通。这种把存储与检索两个过程、标引员与检索者两个方面联系起来表达相同概念和主题的语言就是检索语言,也叫索引语言、标引语言。? 检索语言的本质:是对文献所包含知识的组织、文献各方面特征,都能用一种特定的语言(包括词、词组、短语、符号)记录下来,如果把这些词、词组、短语、符号等作为标识,按一定规律排列起来,就等于把文献按某种特征进行组织。检索时,再从这些标识入手,就能检索出某种特征文献信息。这种经过组织形成的标识系统就是检索语言。而这些检索语言就成为文献检索途径,也称为检索字段或检索项。 检索语言的特点:检索语言在表达概念上具有单义性和唯一性,可以保证不同标引者和检索者对信息特征表达上的一致性,从而避免检索与标引之间的歧义与误差,减少误检与漏检。同时,还可使内容相同或相关的信息集中,使大量分散无序的信息系统化、有序化,便于进行有规律的检索。 目前信息检索工具中经常使用的检索语言主要有分类检索语言和主题检索语言。1)分类语言分类语言是以学科体系为基础,用号码作为概念标识,按分类编排的检索语言。国内外比较重要的分类语言表有《国际专利分类表》、《杜威十进分类法》、《中国图书馆图书分类法》、《中国科学院图书分类法》等。2)主题语言主题语言是以语词作为概念标识,按字顺编排的检索语言。主题语言包括标题词语言、单元词语言、叙词语言和关键词语言。(1)标题词语言——最早使用的一种主题语言。它以规范化的自然语义作为标识,来表达文献涉及的主题概念,并将全部标识按字母顺序排列。表达主题的词语称为标题词。(2)单元词语言——是从文献内容中抽选出来的最基本的词汇,将代表最一般、最基本的、不可再分割的概念单元的词作为单独标引文献的单位。(3)叙词语言——从自然语言中优选出来并经过规范化处理的名词术语。叙词语言是采用表示单元概念的规范化语词的组配来对文献内容主题进行描述的检索语言,也是目前使用最广泛的主题语言。(4)关键词语言——直接从文献题名、文摘或正文中抽取出来的未经规范化处理的词。是一种用自然语言做标识的检索语言。2索引 索引是印刷型检索工具中的一个概念,就是将文献中的一些重要的、有检索价值的知识单元 , 如人名、题名、分类号、主题词等, 根据需要分别摘录出来 , 并注明它们所在的位置 ( 页码或文献号 ), 再按一定的规则排列和组织, 附在检索工具之后, 或单独编辑成册, 便于人们“按图索骥”地获取隐含于文献中各种数据和资料。最常用的索引有著者索引、主题索引、分类索引、题名索引。在计算机检索系统中,各种索引的界限已经十分模糊,一般数据库都是按字段著录相应的内容,而各个字段都可以作为检索入口(也称作检索点)进行检索,还可以在不同字段间进行组配。如果要提高查全率,甚至可以对文摘或全文进行检索。2.1著者索引:是按文献上署名的个人姓名、团体机构名称的字顺排列的。一般来说,著者索引的编制和检索是比较简单的,中文的著者索引常用汉语拼音法或笔画笔顺法排列,西文的著者索引则按字母顺序排列。但也常常会有一些较为复杂的情况,如姓氏的单姓、复姓,带前缀的姓和带冠词的姓等。须注意的几条西文著者索引排列规则有:( 1 )姓在前,名在后,同姓者按名字的字顺排列。由于外国人名常用缩写的形式,也有些著者索引对同姓著者,不管其名字是否齐全,均以名字的首字母字顺排列。( 2 )姓前冠有 Mc 、 M 的,按 Mac 排入字顺,姓前冠有 Saint 及其变形如 St 、 Sainte 和 Ste 的,一律按 Saint 的字顺排列,带有 de 、 la 、 van 、 von 的,作为姓的整体处理,姓中有 ǎ、ǔ、ǒ者,将其变成 ae 、 ue 、 oe 排入字顺。( 3 )带连字符的姓,按一个单元看待,复姓著者,按单姓对待。 著者途径的检索,最关键的是要注意区分同名异人和同人异名的情况。2.2主题索引:以主题词为标目 , 按照主题词的字顺排列组织的索引。按照组织主题词的原则和方法上的不同 , 主题索引可分为标题词索引、关键词索引、单元词索引和叙词索引四种。 标题词索引是以标题词作为文献内容的标识和查找的依据。标题词是一种规范化的检索语言,是从自然语言中选取的、经过规范化处理的、表示事物概念的词、词组或短语。标题词可以由主、副标题构成 , 有时副标题下再带一个次副标题 , 使标题词之间形成了两个以上的等级概念。但使用标题词语言编制的标题词表中的主、副标题词是事先固定组配的,属于先组式索引,目前已很少使用。 关键词索引是以关键词的字顺排列的索引。关键词是直接从原文的标题、摘
文档评论(0)