数据挖掘以与搜索引擎经典pptchap3.pptVIP

  • 2
  • 0
  • 约1.67千字
  • 约 40页
  • 2017-08-23 发布于河南
  • 举报
数据挖掘以与搜索引擎经典pptchap3

第三章;检索评测基础;检索性能评价;测度1:查全率和查准率;测度2: F1 值;F1 值的其他说法;测度3:查准率/查全率曲线;Example;Ranking for query q: d123* d84 d56* d6 d8 d9* d511 d129 d187 d25* d38 d48 d250 d113 d3*;多个查询下的查准率/查全率曲线,可通过计算其平均查准率得到,公式如下(Nq为查询的数量) ;由于每个查询的查全率值不一定就是这11个标准查全率,因此需要对查准率进行插补。 如上例中,若Rq只含有3个文档 Rq = {d3, d56, d129}. 此时,如何计算11点标准查全率呢?(查全率1/3,2/3,1} 设rj{j=0,1,2,…,10}为第j个标准查全率的一个参量 (如r3是查全率为30%的参量),则: 即第j个标准查全率水平的查准率是介于第j个和第j+1个查全率之间任意一个查全率所对应的查准率的最大值。; Rq = {d3, d56, d129} ;多个查询下进行检索算法的比较;另一种方法是:计算给定文档临界值处的平均查准率。如检出相关文档数为:5、10、15、20、30、50、100时的平均查准率。 ? 目前平均查准/查全率的值已经成为信息检索系统的一项标准评价指标。 它能对整个结果集的质量和检索算法的适用范围进行量化评价,因此非常有效。;测度

文档评论(0)

1亿VIP精品文档

相关文档