- 2
- 0
- 约1.67千字
- 约 40页
- 2017-08-23 发布于河南
- 举报
数据挖掘以与搜索引擎经典pptchap3
第三章;检索评测基础;检索性能评价;测度1:查全率和查准率;测度2: F1 值;F1 值的其他说法;测度3:查准率/查全率曲线;Example;Ranking for query q:
d123*
d84
d56*
d6
d8
d9*
d511
d129
d187
d25*
d38
d48
d250
d113
d3*;多个查询下的查准率/查全率曲线,可通过计算其平均查准率得到,公式如下(Nq为查询的数量)
;由于每个查询的查全率值不一定就是这11个标准查全率,因此需要对查准率进行插补。
如上例中,若Rq只含有3个文档 Rq = {d3, d56, d129}.
此时,如何计算11点标准查全率呢?(查全率1/3,2/3,1}
设rj{j=0,1,2,…,10}为第j个标准查全率的一个参量
(如r3是查全率为30%的参量),则:
即第j个标准查全率水平的查准率是介于第j个和第j+1个查全率之间任意一个查全率所对应的查准率的最大值。; Rq = {d3, d56, d129} ;多个查询下进行检索算法的比较;另一种方法是:计算给定文档临界值处的平均查准率。如检出相关文档数为:5、10、15、20、30、50、100时的平均查准率。
?
目前平均查准/查全率的值已经成为信息检索系统的一项标准评价指标。
它能对整个结果集的质量和检索算法的适用范围进行量化评价,因此非常有效。;测度
原创力文档

文档评论(0)