- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索之检索语言讲解材料.pptx
信息检索的原理4、分类语言的依据和特征,课题概念分类的方法。5主题检索语言和关键词检索语言的主要区别是什么?6、什么是数据库?文献型数据库的结构7、布尔逻辑检索有哪几种,其功能是什么?分类语言的依据和特征,课题概念分类的方法。?什么是检索语言??检索语言是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。什么是分类语言?分类语言也称分类法。用分类号和相应的分类款目来表达各种概念,以学科体系为基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序,能反映事物的从属派生关系,便于按学科门类进行族性检索。按照分类方式的不同,分类语言又分为体系分类语言、组配分类语言和混合分类语言。? 分类语言的依据中国分类法专利分类法标准分类法中国分类法A 综合……………………………………00/09 标准化管理与一般规定10/19 经济、文化20/39 基础标准40/49 基础学科50/64 计量65/74 标准物质75/79 测绘B 农业林业………………………………00/09 农业、林业综合10/14 土壤与肥料15/19 植物保护20/29 粮食与饲料作物30/39 经济作物40/49 畜牧50/59 水产、渔业标准分类法(一)表达文献外部特征的检索语言 表达文献外部特征的检索语言主要是指文献的篇名(题目)、作者姓名、出版者、报告号、专利号等。将不同的文献按照篇名、作者名称的字序进行排列,或者按照报告号、专利号的数序进行排列,所形成的以篇名、作者及号码的检索途径来满足用户需求的检索语言。 描述文献外表特征的检索语言可简要概述为:题名、著者、文献编号等索引。(二)表达文献内部特征的检索语言 1. 分类语言 分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。 以知识属性来描述和表达信息内容的信息处理方法称为分类法。 课题概念分类单概念课题多概念课题上位类分类法主题检索语言和关键词检索语言的主要区别是什么? 主题词与关键词最大的区别就是主题词经过了规范化处理。?? 主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:白介素2、白细胞介素2、IL2、IL-2等表达同一概念的不同书写形式规范为“白细胞介素2”。???。 主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。 关键词是属于自然语言的范畴,未经规范化处理,也不受主题词表的控制。如:对于“白细胞介素2”这一概念可有白介素2、白细胞介素2、IL2、IL-2等不同形式来表达。? 因此,为了达到较高的查准率和查全率,如果检索工具提供了主题词这一检索途径的话就应该选择主题词来进行检索,而不应该选择关键词。?例如:利用MEDLINE光盘数据库检索有关“肝肿瘤”方面的文献。?MEDLINE光盘数据库既提供了主题词途径,也提供了自由词(关键词)途径。如果选择关键词途径来进行检索,欲达到较高的查准率和查全率,就得查找“liver cancer”、“liver carcinoma”、“liver neoplasm”、“liver tumor”、“hepatic cancer”、“hepatic carcinoma”、“hepatic neoplasm”、“hepatic tumor”等词,另外还得考虑像cancer、carcinoma、neoplasm、tumor等词还有复数形式;而如果选择主题词途径进行检索就只需查找“liver neoplasms”一词就行了,这一词就包括了以上所提及的不同的表达形式。由此可见,选用主题词途径检索,既能满足较高的查准率、查全率,又能提高检索速度,何乐而不为呢?什么是数据库?文献数据库的结构. 数据库的定义 数据库是指至少由一种文档组成,能满足特定目的的或特定功能数据处理系统需要的数据集合。在计算机情报检索系统中,多数数据库为关系型数据库。数据库的类型按照数据库所含信息内容的不同,文献数据库可分为文字型、数值型和多媒体型多媒体型数据库是指含有字符、声音、图像信息的数据库。这种数据库一般为超文本结构。他们既可以用于查找相文献信息,也可以用于查找特定的属性值、声音和图像。文字型数据库是指以文字字符为主要记录内容的数据库,包括书目型、事实型、百科全书型、词库型和全文型数据库。这类数据库主要用于查找相关文献信息。数值型数据库包括来自科学研究,原始文献或者调查研究的各种数值型或图表型数据库。这类数据库
文档评论(0)