网站大量收购闲置独家精品文档,联系QQ:2885784924

【信息检索课件】信息检索效果.pptVIP

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
4-3 Information Retrieval Effectiveness 信息检索效果的概念和研究状况 检索效率指标 提高检索效率的措施 思考题 一、信息检索效果的概念和研究状况 信息检索效果是利用检索系统进行检索所产生的有效结果。 Cranfield试验及其主要结论 ⑴ UDC、标题语言、元词语言和专业组面分类法等4种索引语言性能相差无几。 ⑵ 如果同时考虑查全率和查准率两个性能,那么检索效果最好的是自然语言。 ⑶ 收录范围、查全率、查准率、响应时间、用户负担和输出形式等6项是评价检索效果和检索系统的主要指标。 ⑷ 查全率与查准率存在互逆相关关系。 王云等对截词检索、条件检索、关键词检索、分类号检索、作者检索、期刊检索及其检索效果等进行了实证研究。 What to Evaluate? What can be measured that reflects users’ ability to use system? Coverage of information Form of presentation Effort required/ease of use Time and space efficiency Recall Proportion of relevant material actually retrieved Precision Proportion of retrieved material actually relevant 二、检索效率指标 检索效率是指评价检索系统性能和质量的各种比率。包括查全率、查准率、新颖率、检索速度、检索方便性和成本效益比等。 F·W·Lancaster 2×2表: 1、Recall ratio 查全率:检出的相关文献数与系统内的相关文献总数之比(W·佩里和A·肯特,1956)。 R=检出的相关文献/文献内相关文献总数×100%。漏检率=未检出的相关文献数/文献库内相关文献总数×100%。 在公式中,a值经过一次检索即可确定,而c值即漏检文献数一般可以用下列4种方法测定出来:(1)若n值不大,逐篇鉴别各篇文献;(2)若n值很大,可对检出的文献随机抽样;(3)由有经验的用户去鉴别检出的文献;(4)通过不同途径去检索同一课题的文献,把各次检出的文献加在一起,剔除重复,形成一份较完整的相关文献清单,以此对比每次检出的相关文献,即可知道相应的c值。 2、Precision ratio 查准率:检出的相关文献数与检出的文献总数之比,它是衡量一个检索系统的信号噪声比,测度检索系统拒绝非相关文献能力大小的一项指标(佩里和肯特,1956)。 P=检出的相关文献数/检出的文献总数×100%。与此相应,我们称系统检出的非相关文献数与检出的文献总数的比率为误检率(Noise ratio),其值为b/a+b,它是查准率的补数。 Relevant vs. Retrieved 3、R-P关系 C·W·Cleverdon指出,在同一个检索中,当R和P达到一定阀值,即查全率为60~70%,查准率为40~50%后,二者呈互逆相关。 (1) Get as much good stuff while at the same time getting as little junk as possible; (2) There is a tradeoff between Precision and Recall; (3) So measure Precision at

文档评论(0)

精品资料 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档