信息技术复习资料答案.doc

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.掌握信息检索效果的评价方法,特别是查全率、查准率的计算。(p50) 信息检索效率的评价 ???信息检索效率是指信息检索的准确性和全面性,分别以查准率和查全率两个指标来表示。 ???1.查准率和查全率 ???查准率和查全率是信息检索效率评价的两个定量指标,不仅可以用来评价每次检索的准确性和全面性,也是在信息检索系统评价中衡量系统检索性能的重要方面。 ???查准率(Precision ratio,简称为P),是指检出的相关文献数占检出文献总数的百分比。查准率反映检索准确性,其补数就是误检率。 ???查全率(Recall ratio,简称为R),是指检出的相关文献数占系统中相关文献总数的百分比。查全率反映检索全面性,其补数就是漏检率。 ???在信息检索系统中,每进行一次检索,就把系统中所有的文献分为四个部分(见图14-1)。 图14-1 ?检索中的系统文献 ???其中:a表示检出的相关文献,即合理的命中;b表示检出的非相关文献,即误检;c表示未检出的相关文献,即漏检;d表示未检出的非相关文献,即合理的排除。a+b表示检出的全部文献;c+d表示未检出的全部文献;a+c表示与提问相关的全部文献;b+d表示与提问不相关的全部文献;a+b+c+d则表示检索系统中的所有文献。 ???那么,查准率和查全率的计算公式分别为: 查准率 ?P= (a/a+b)×100% 查全率 ?R= (a/a+c)×100% ???例如:在一次检索中,共检出文献100篇,经过专家判定,其中与提问相关的文献为60篇,其余的40篇为误检文献,那么按照上述公式,本次检索的查准率P就等于(60/100)×100%即60%。假如检索系统中还有90篇相关文献,由于各种原因而未被检出(漏检),那么按照上述公式,本次检索的查全率就等于(60/60+90)×100%即40%。 ???可见,利用上述公式,对每一次信息检索,都可计算出其查准率和查全率,对检索效率作出定量化的评价。 ???但是,如果进一步分析,就会发现查准率的计算没有问题,而查全率的计算存在明显的问题。那就是怎样知道漏检文献的数量。 ???对于小型的试验系统,在进行检索效率评价时,只要把系统中所有的文献都浏览一遍,就能准确地获得漏检文献的数量。然而,在实际运行的检索系统中,由于系统文献总量通常数以百万计,在评价检索效率时,根本不可能把浏览系统中所有的文献,因此,也就无法知道漏检文献数量。 ???所以,在实际的检索评价中,对于漏检文献数量,一般采用近似的估计值。获得漏检文献数量估计值的方法有两种:其一,利用其他的同类检索系统,进行相同的检索,然后通过对命中结果的分析和比较,推断哪些文献被漏检;其二,利用原有的检索系统,放大检索范围进行查找,然后对命中结果进行分析,看是否有原先未被检出的相关文献,从而得到漏检文献的近似值。 ???2.查准率与查全率之间的关系 ??利用查准率和查全率指标,可以对每一次检索进行检索效率的评价,为检索的改进调整提供依据。利用这两个量化指标,也可以对信息检索系统的性能水平进行评价。 ???要评价信息检索系统的性能水平,就必须在一个检索系统中进行多次检索。每进行一次检索,都计算其查准率和查全率,并以此作为坐标值,在平面坐标图上标示出来。通过大量的检索,就可以得到检索系统的性能曲线(见图14-2和图14-3,从图中可见检索系统1的性能水平,要高于检索系统2)。  所谓的信息检索语言就是信息组织与信息检索时所用的语言,也称文献检索语言、情报语言等。信息资源在存储过程中,其内容特征(分类、主题)和外部特征(如书名、刊名、题名、著者等)按照一定的语言来加以表达,检索文献信息的提问也按照一定的语言来表达,为了使检索过程快速、准确,检索用户与检索系统需要统一的标识系统,这种在文献信息的存储与检索过程中,共同使用、共同理解的统一的标识就是检索语言。信息检索语言主要有两大类:分类检索语言和主题检索语言。 2.根据研究课题实例,制定相应的检索策略。 一、分析课题 随着陆地开发的逐步深入,人类把目光投向了占地球面积71%的海洋。海岛开发成为各国海洋战略关注的焦点。海岛开发主要集中在海岛旅游、海岛资源的开采等方面,这种无序的开发模式最终导致海岛生态系统功能丧失、海岛及周边水域环境日益恶化等问题的产生。尽管很多国家采取了海岛资源开发与环境保护并举的策略,但是不能从根本上解决问题。为了科学、合理、有序地开发海岛,需要在研究海岛现有开发模式的基础上,系统研究海岛可持续开发的模式。 海岛可持续开发总体上属于经济与管理学科,其管理的对象是海岛,研究的重点是海岛的开发模式,与当前海洋综合管理研究的热点相适应。涉及到的相关概念主要有:海岛、岛屿、海洋开发、可持续开发、海洋综合管理等名词。其可

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档