- 1、本文档共62页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索语言 1 检索语言的的概念与作用检索工具之所以成为检索工具,在于它的著录款目是按照一定的排检方法组织起来的,能够提供一定的检索手段。决定检索工具中大量文献线索的排检序列的关键,是以文献特征进行标引而得到的文献的标识。在一个检索工具或检索系统中,千千万万的文献著录款目是根据其标识,或按字顺或按逻辑次序(一般用号码或字母表示)而编排起来的。标识是提示文献内容特征或外表特征的“标签”,是文献最简洁的代表,也是文献检索所据以进行的“存取点”。为了使检索的过程,即文献标识和信息提问的对比进行得顺利,二者都需要用一定的语言来加以表达。只有借助于这种语言,文献的标引人员与检索人员才能有一个共同的约定,彼此才能沟通思想。也就是说,文献存储时,文献的内外特征按照一定的语言来加以描述,而检索时信息提问也按照一定的语言来加以表达。这种把文献的存储与检索联系起来、把标引人员与检索人员联系起来以便取得共同理解、实现交流的语言,就叫做检索语言。检索语言是用来描述文献特征和表达检索提问的一种专门语言。检索效率的高低,在很大程度上取决于所采用的检索语言的质量以及对它的使用是否正确。下图展示了检索语言在信息存储和检索过程中的作用。 ● 按检索标识的规范与否来分 检索语言可分为人工语言(或受控语言)和自然语言。人工语言(artificial language)是根据信息检索的需要而由人工创制的,采用规范化的词语(controlled term)来专指某个概念或网罗与之相应的概念,可以将同义词、近义词、相关词、多义词及缩略词规范在一起,包括分类检索语言(分类号)、主题检索语言和代码检索语言。自然语言(natural language)检索用词是从信息内容本身抽取的,主要依赖于计算机自动抽词技术完成,辅以人工自由标引,是非规范词(uncontrolled term)。自然语言包括:关键词(keyword)、题名、作者、摘要、全文、引文等。一部分类法实质上就是一套概念标识系统。 体系分类法采取对文献论述的事物概念进行层层划分、层层隶属的办法来形成一系列专指的分类标识,按照科学体系将分类标识组织成具有隶属、并列关系的概念等级标识系统。分类法虽然比较具有学科的系统性,但它所能反映的这种科学系统性,只是在一定的限度之内。现代科学由于边缘学科、交叉学科的出现,各门学科互相渗透,互相结合,日益使直线序列的分类法难以反映多元性的知识空间,因而不能确切地代表科学体系。 一部完整的分类法一般由以下四个部分组成: ①编制说明。主要说明该分类法的编制过程、所依据的编制原则、类目的设置和编次的理由,对各种分类问题的技术处理、使用扣标引方法等。 ②类目表。包括:大纲一一基本大类一览表;简表——基本类日表;详表一—主表,是分类法的主体;辅助表一一一组组标准字目表,用以对主表中列举的类目进行细分。 ③索引。是分类法的类日名称索引,按字顺排列,以帮助不熟悉分类法的读者使用。 ④附录。收录按类检索时经常要查问的一些参考资料。 常用分类法介绍我国大部分图书馆通常采用的分类法是《中国图书馆图书分类法》(简称《中图法》超链内容为图书馆主页简表),其次是《中国科学院图书馆图书分类法》(简称《科图法》)和《中国人民大学图书馆图书分类法》(简称《人大法》)。美国图书馆最通用的是《美国国会图书馆图书分类法》(Library of Congress Classification),简称《国会法(LC)》和《杜威十进分类法》(Dewey Decimal Classification),简称《杜威法(DDC)》。 我国最通用的分类法——《中国图书馆分法》,简称中图法 基本结构 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 《中国图书馆分类法》 例:层层展开 T工业技术 TP自动化技术、计算机技术 TP3计算技术、计算机技术 TP31计算机软件 TP311程序设计、软件工程 TP311.1程序设计 TP311.13数据库理论与系统 TP311.131数据库理论 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》 2.2 主题语言:由主题词汇构成,即将自然语言中的名词术语经过规范化后直接作为信息标识,按一定顺序排列,通过参照系统揭示主题概念之间的关系,也称主题法。主题语言表达的概念
文档评论(0)