信息检索(1章)-ppt.ppt

  1. 1、本文档共123页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息检索(1章)-ppt

有关互联网的知识分类为 TP393.4 T 工业技术 TP 自动化技术 计算机技术 TP3 计算机技术 TP39 计算机的应用 TP393 计算机网络 TP393.4 国际互联网 “网络游览器”类号、类目展开示例 TP3 计算技术、计算机技术 TP39 计算机应用 TP393 计算机网络 TP393.0 一般性问题 TP393.09 计算机网络应用程序 TP393.092 网络游览器 网址资源、 Netscape、 Netscape、主页制作等入此。 分类标引方法(图书标识码) 崔文风著 1)心理与人生-发展心理 教子成长 2)心理与人生-完善心理 事事成功 3)心理与人生-调节心理 强身治病 分别分入: G78、 B848.4 和R395.6-49 ,其索书号分别是G78/CWF、B848.4/CWF和R395.6-49/CWF 眼睛的制作: 1.3.4 主题检索语言 主题检索语言是以自然语言中语词文字为基础,以反映特定事物为中心,以主题词字顺为基本结构的一种检索语言。 将主题词作为信息主题标引和检索标识的编排方法称为主题法。 1、主题检索语言的主要类型 主题检索语言根据其结构原理可分为: 标题词:事先组配好的主题词,是一种先组式的语言 单元词:代表文献实质意义、可以独立存在的最小概念单元。是一种后组式的语言。 叙词:经规范化的可以独立表达主题概念的词语。 关键词:直接使用的基本上不加规范的自然词语。 2 《汉语主题词表》:也称为叙词表。由主表、附表和辅助索引组成。 1.3.5 分类—主题法检索语言 1.3.6 自然语言 1.4 信息检索效果评价 信息检索的效果评价是指运用科学的方法,按照设定的指标体系,对信息检索效果进行评价的过程。目前主要从三个方面进行评价。 是对检索系统满足检索要求的有效程度的评价,主要以”新”“全” “准”为评价标准。 若要了解科技的最新动态、学科的进展、研究前沿、探索未知,则强调一个“新”字 若要解决研究中的具体问题,则要强调一个“准”字 若要了解一个全过程,就要回溯大量文献,要求检索的全面、详尽、系统,则要强调一个“全”字。 1)查全率和查准率 是由美国的佩里和肯特于20世纪50年代中期提出来的,后经过不断改进和完善,至今已成为评价检索效果最常用的两项关键指标。确定查全率和查准率最常用的方法是有名的2×2表: 查全率指检出的相关文献量与检索系统中相关文献信息总量的比率,它反映出信息检索系统检出相关文献信息的能力。 查全率(R)=(检出相关文献信息量/检索系统中相关文献信息总量)×100% =(a/a+c)×100% 查准率是指检出相关文献信息量与检出文献信息总量的比率,它反映出信息检索系统的精确度,说明系统排除干扰,减少噪音的能力。 查准率(P)=(检出相关文献总量/检出文献信息总量)×100% =(a/a+b)×100% 提高查全率、查准率的措施 1、提高查全率的方法 (1)选择最大字段:如摘要、全文、任意字段、所有字段 (2)选择同义词:近义词、缩写词, 上下位类词。 (3)复合词汇的分解:将一词分解为多词。 (4)采用模糊检索功能。 2、提高查准率的方法 (1)选择最小字段:如T、K字段。见选择最大字段。 (2)尽量增加核心检索词:从内容中挖掘核心词。 (3)使用词位检索:如,在SCIE检索中利用same。 (4)采用短语检索:如,在EI、SCIE使用双引号或{ }。 (5)采用精确检索功能:见模糊检索功能 (6)利用同名作者功能:如VIP数据库。 大忌:检索同一课题不能更改年代范围!!! 2)漏检率与误检率 漏检率指漏检相关文献信息量与检索系统中相关文献信息总量的比率,它与查全率相对应。 漏检率=(漏检相关文献信息量/检索系统中相关文献信息总量的比率)×100% =(c/a+c)×100% 误检率是指误检(检出不相关)文献信息总量与检出文献信息总量的比率,它与查准率相对应。 误检率=(误检文献信息量/检出文献信息总量)×100%

文档评论(0)

cgtk187 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档