- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三讲信息检索原理与检索语言_
第三讲 信息检索原理与检索语言 检索方法
一、 信息检索的两种方法
信息检索有两种方法。一是直接从信息源和信息文献载体中获取信息。称为直接检索索。二是通过信息检索工具的指引获取所需的信息,称为间接检索。
直接检索是信息用户常用的检索方法。用这种方法检索时,可以明确判断所检到的信息是否符合需要,且对非文献载体的信息检索来说比较快速、方便。但对于现代大规模的信息检索,很难准确、系统的查到所需的全部信息。
间接检索克服了直接检索的缺点。它把信息“贴上”分类号或主题词等多种检索标志,并按照这些标志把信息有效地组织起来,在信息检索时利用检索标记可以查到所需信息的线索或信息本身。
二、信息检索的原理
直接检索的原理比较简单,即通过一定方法从信息源收集信息或直接浏览信息的文献载体获取信息。
间接检索则要通过信息检索系统来实现。信息检索系统运作的全过程包括存贮和检索两个过程。存贮过程就是运用检索语言对信息的外表特征和内容特征进行标引,形成文献特征标识,检索过程则先对检索提问进行标引,形成检索提问标识,按照存贮所提供的检索途径,查获与检索标识相符合的文献特征标识的过程,检索过程是存贮过程的逆过程。
三、检索语言的概念合作用
检索语言识一种专门的人工书面语言,它是信息检索系统存贮过程和检索过程所使用的共同语言。其最终目的是为检索而用,故名为检索语言。
存贮――标引
} 依据
检索――标引
检索语言的作用
(1) 检索语言用于标引信息的主题,可把信息的内容特征及外表特征简明而有效地揭示出来;
(2)检索语言通过对信息的标引,把内容相同及相关的信息集中在一起,加上检索语言本身的可序列化,从而可对大量信息进行系统化和组织,使规律的检索成为可能。
图书的排架、 索书号: I712.45/2H。。。。。。
(3)检索语言的单一性和表述概念的唯一性以及检索语言在信息标引和信息检索时的同时运用,决定了存贮标识和检索标识的有效比较,为准确输出所需信息提供了前提
理论上
实际: 关键词:电脑
计算机
汉字输入法
汉字字形输入法
内容 标识标引、主观性
寻找所有可能检索入口
或使用一些组配技巧
检索语言的种类
1、 文献检索语言,反映的是文献信息的内容特征和外表特征。所以可以分为反映文献外表特征(著者、书篇名、号码)的语言和反映文献内容特征的语言。
表述文献外表特征的检索语言简单易懂,其形成的又非主要检索途径,故在检索语言中不予专门论述,通常所说的检索语言一般均指表述文献信息内容特征的语言。
2、按组配方式分,检索语言有先组式检索语言和后组式检索语言两大类。所谓组配就是将两个或两个以上的主题词按照一定的逻辑关系结合在一起表达文献主题或表达检索需求,称为主配标引。如:用动物学:遗传学表示动物遗传学
(关于先组式检索语言和后组式检索语言,以后有机会再通过具体例子说明)
3、按检索语言的结构原理来分,检索语言有分类语言、主题语言和分类主题一体化语言三大种类。
(1) 分类语言:分类语言式检索语言的一种主要类型,它可以分为体系分类语言和组面分类语言两种。
体系分类语言是一种传统的分类语言,具有列举时类目、分类符号标识、等级制结构、线性序列等特点。(以中图法为例展开文学大类)
按信息的学科属性来区分文献信息,在编制体系分类表时列举了所有的类目,一个类目只能归入一个学科,并用符号来表示相应的类目。
体系分类语言不能容纳主题概念的发展,其直线性系列无法按事物集中文献,所以后来发展出了组面分类。
汽车――设计
――销售
――空气调节
组面分类法,按学科范畴分为若干个组面,每个组面包括若干类目,每个类表示一个简单的主题概念(标引时组配,举例说明)。用分类符号作为组面和类目的标记。
4.主题语言:主题语言是用规范化自然语言作为揭示文献信息主题的标目,并按照字顺组织文献信息或检索文献信息的一种检索语言。它包括标题词语言、单元词语言、叙词语言、关键词语言
标题词语言――SHE
――主标题词、副标题词
文档评论(0)