- 1、本文档共76页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章第三章 数据库检索通讲数据库检索通讲
33.11 信息检索技术及相关信息检索技术及相关
信息检索的含义与实质信息检索的含义与实质
• 通常是指从以任何方式组成的信息集合中,查
找特定用户在特定时间找特定用户在特定时间和条件条件下所需信息的方所需信息的方
法与过程。
• 实质是将描述特定用户所需信息的提问特征实质是将描述特定用户所需信息的提问特征,,
与信息存储的检索标识进行异同的比较,从中
找出与提问特征找出与提问特征一致或基本致或基本一致的信息致的信息。
提问特征是对信息的需求进行分析,从中选
择出能代表信息需求的主题词择出能代表信息需求的主题词、分类号或其他分类号或其他
符号。
信息检索的类型信息检索的类型
• 书目信息检索
• 全文信息检索全文信息检索
• 数据信息检索数据信息检索
• 事实信息检索
信息检索效率信息检索效率
• 信息检索效率是研究信息检索原理的
核心核心,,是评价是评价一个检索系统性能优劣的个检索系统性能优劣的
质量标准,它始终贯穿信息存储和检索
的全过程的全过程。
• 衡量检索效率的指标有查全率、查准
率率、漏检率漏检率、误检率误检率、响应时间等响应时间等。。
• 查全率
利用检索系统进行某一课题检索时利用检索系统进行某一课题检索时,检检
出的相关信息量(w )与该系统中存储的相
关信息量关信息量 ((X ))的比率再乘以的比率再乘以100%%,称为称为
查全率(R ),用公式表示如下:
R= ( W/X ) ×100%
• 查准率
利用检索系统进行某利用检索系统进行某一课题检索时课题检索时,检检
出的相关信息量(w )与检出信息总量(M )
的比率再乘以100%,称为查准率(P ),
用公式表示如下:
P=( W/M ) ×100%
信息检索技术
• 布尔检索
• 截词检索截词检索
• 邻近检索邻近检索 ((短语检索短语检索))
• 字段检索
布尔检索
• 所谓“布尔检索”是指通过标准的布
尔逻辑关系词来表达检索词与检索词之尔逻辑关系词来表达检索词与检索词之
间逻辑关系的检索方法。
主要的布尔逻辑关系词有主要的布尔逻辑关系词有:
AND或或*
OR或+
NOT或或-
• AND关系
称为逻辑与(逻辑乘),用关系词
ANDAND表示表示。。表示它所连接的两个检索词表示它所连接的两个检索词
必须同时出现在结果中才满足条件。
AA ANDAND BB
• 例如:
二氧化碳超临界在皮革二氧化碳超临界在皮革、、食品行业中的运用食品行业中的运用。。
二氧化碳and 超临界and 皮革
carbon and dioxide and supercritical and leather
二氧化碳二氧化碳andand 超临界超临界andand 食品食品
carbon and dioxide and supercritical and food
• OR 关系
称为逻辑或(逻辑加),用关系词
OROR表示表示。。表示它所连接的两个检索词中表示它所连接的两个检索词中
任意一个出现在结果中就满足检索条件。
AA OROR BB
• 例如:
二氧化碳超临界在皮革和食品行业中的运
用。
二氧化碳and 超临界and (皮革or 食品)
• NOT关系
称为逻辑非(逻辑减),用关系词
NOTNOT表示表示。。表示它所连接的两个检索词表示它所连接的两个检索词
中应从第一个概念中排除第二个概念。
AA NO
文档评论(0)