信息检索策略和方法.ppt

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一页,共15页 二、检索表达式 检索表达式是检索策略的具体体现,简称检索式。检索式一般由检索词和各种逻辑运算符组成,具体来说,它将检索词之间的逻辑关系、位置关系等用检索系统规定的各种算符连接起来,成为计算机可以识别和执行的命令形式。 第二页,共15页 (一)逻辑表达式 逻辑表达式是指利用布尔算符,对检索词的关系进行表达,又称布尔逻辑表达式。布尔算符是19世纪中叶英国数学家乔治·布尔发明的,以集合论与布尔逻辑为理论基础,是目前计算机检索最简单、最基本的匹配模式 。 第三页,共15页 (二)加权表达式 为了弥补逻辑表达式的不足,人们提出了加权检索。所谓加权检索,是指在检索提问中,根据每个检索词在检索要求中的重要程度,分别给予一定的数值加以区别,即赋权,这个数值称权值,然后对含有这些检索词的文献进行加权计算,其和在规定的阈值以上的,即确认为命中文献。 第四页,共15页 (三)位置检索表达式 两个检索词在文献中相隔的距离不同,可能会在一定程度上带来检索结果的差异,单纯依靠逻辑表达式,不能满足多种检索需求。因而,人们又引进了位置检索表达式,也称邻近检索。 第五页,共15页 (四)截词检索表达式 截词检索表达式指在检索式中用专门符号(截词符号)表示检索词的某一部分,允许有一定的词汇变化,也就是说,检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词。 第六页,共15页 (五)限制检索表达式 在信息检索的实际过程中,有时还需要将检索词限制在标题、文摘等字段内。限制检索也称字段检索。限制检索表达式指用限制符限定检索词出现范围的检索式。 第七页,共15页 三、检索策略的构造步骤 1.分析信息需求(检索课题),明确检索要求 2.选择检索系统 3.选择检索途径和检索方法,确定检索词或检索式 4.实施信息检索 5.获取原始文献 第八页,共15页 四、检索策略的反馈与调节 信息检索过程是一个比较复杂的过程,受到诸多因素的影响,一次检索的结果往往不能完全满足检索要求,有时会造成一些检索偏差。这就需要我们及时调整检索策略,纠正检索误差,以便获取满意的检索结果。 第九页,共15页 (一)影响查全率和查准率的主要因素 (1)主题分析是否准确、全面。 (2)检索词选择是否准确。 (3)检索词之间逻辑关系的配置是否合适。 第十页,共15页 (二)提高查全率和查准率的方法 1.提高查全率的方法 2.提高查准率的方法 第十一页,共15页

文档评论(0)

xiaolan118 + 关注
实名认证
内容提供者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档