科技信息检索—08.第2章.信息检索和信息检索系统.第3讲.pptVIP

科技信息检索—08.第2章.信息检索和信息检索系统.第3讲.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主题语言 主题语言 是直接以代表文献内容特征和科学概念作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言 主题词语言种类:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词汇之间的关系。 关键词语言(keyword) 关键词(keyword)语言是自然语言,直接取自文献的题名、文摘等,或者取自全文。除了禁用词(stop-term),如一些冠词、介词、副词或连词外,凡在概念上有意义的词都可用作关键词,它确保检索用词与文献记录中的词汇完全一致。 关键词有词表,一般按字顺排序,由关键词作索引标目的就是关键词索引,这些关键词可以进行组配。 标题词语言(subject heading) 标题词语言是最早出现的一种按主题来标引和检索文献的传统检索语言,是一种先组式规范化检索语言,采用的标题词是经过规范化的标引文献主题概念的词。在检索前这些标题词已经固定好组配,在标题词表中出现的两级标题词以固定的组合方式组织在词表中,检索时按既定组配执行。其特点是有较好的通用性、直接性和专指性,但灵活性较差,适宜于从事物的主题概念出发而进行的检索。 常用的标题词表有:EI所用的《工程标题词表》(Subject Headings for Engineering,SHE)、《美国国会标题词表》(Library of Congress Subject)、《医学主题词表》(Medical Subject Headings) 叙词语言(descriptor) 为了适应计算机检索的需要,叙词语言于20世纪60年代产生,它既吸收了分类语言的优点编制了叙词分类索引和等级索引,又吸收了标题词语言的优点编制了参见著录项目。因此,叙词语言既适用于手工检索,又特别适用于计算机检索。 叙词是指从文献内容中抽出来,能概括表达文献内容基本概念的并经过规范化的名词或术语。其持点是具有组配性,通过概念组配来表达主题。两个或两个以上的叙词组配在一起,形成一个新概念,数量不多的叙词可组成许多概念,便于提高标引专指性和检索的灵活性。 叙词语言是一种规范化的检索语言,在检索时可由多个叙词组成任意合乎逻辑的组配,形成多种检索方式。 常用的叙词表有:INSPEC的词表《INSPEC Thesaurus》、Ei的《EI Thesaurus》及我国编辑出版的《汉语主题词表》等。 《INSPEC主题词表》字顺结构 《INSPEC 主题词表》等级表结构 单元词语言(uniterm) 单元词是指从文献中抽取出来的,能表达文献主题的最基本、不能再分的单元词语,又称元词。它从文献内容中抽出,经过规范,能表达一个独立的概念,具有灵活的组配功能。单元词是不能再分解的概念单元的规范化词,用来标引文献的主题概念。具有灵活的组配性,但是字面的组配不是概念的组配。例如,对于“公路桥梁”这一概念按单元词的做法是通过“公路”和“桥梁”这两个单元词组配来表达该概念,而标题词则直接选用“公路桥梁”这个词组表达它。 实际上,表达事物概念,除了单一概念外,还有许多的复合概念,由于科技不断发展,单元词语言已不能适应信息检索的要求,因此,它已被更先进的叙词语言取而代之。 2.5 检索系统评价 指标体系 评价检索系统必须有一套科学的评价标准,而且每项标准必须定义明确,可以操作和计量,下面介绍各类评价中较常用的一些标准。 2.5 检索系统评价 1.系统的性能指标 用来评价检索系统性能或质量的主要指标有: ① 信息收录的完备性:又称为收录的范围,指系统数据库覆盖的学科范围、信息类型、数量和时间跨度。计算公式为: C=给定时间内系统收录的文献总量/同期相关领域中的实际文献量。 ② 查全率:指系统在实施某一检索作业时,检索出的相关文献的能力,用公式表示为: R=检出的相关文献量/系统中的相关文献总量 *100% ③ 查准率:指系统在实施某一作业时,拒绝不相关文献的能力,用公式表示为, P=检出的相关文献量/ 检索出的文献总量 *100%。 ④ 响应时间:它表示从送交提问到收到检索结果的时间。 ⑤ 输出方式:指检索结果的显示方式,如记录内容和打印格式。 2.5 检索系统评价 2.系统的效益指标 信息检索系统的效益包括社会效益和经济效益。综合体现在以下几个方面 ① 信息和知识的传播速度 ② 信息资源的有效利用率 ③ 节省获取信息的时间和费用等。 3.费用/效益指标 ① 数据库的订购费 ② 学会使用某检索系统所付出的时间和精力 ③ 检出

文档评论(0)

zxli + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档