一种基于置信度差异代价敏感的主动学习算法.pdfVIP

下载本文档

19
0
约6.94千字
约 4页
2017-04-10 发布于北京
举报

一种基于置信度差异代价敏感的主动学习算法.pdf

第 33 卷第 6 期 2013 年 11 月湖北工程学院学报 VOL. 33 NO.6 NOV.2013 JOURNAL OF HUBEI ENGINEERING UNIVERSITY 一种墓于置信度差异代价敏感的主动学习算法武永成 (荆楚理工学院计算机工程学院，湖北荆门 448000) 摘要:主动学习时向专家查询得到的标注如果带有噪声，将会影响学习的性能。为减少噪声，人们提出了基于少数服从多数的多专家主动学习算法，但该算法的缺点是代价往往太高。文章采用了一种自我训练 (self-training) 方法，对某些平均置信度高的样本，直接确定其分类标注，不必向专家查询，以节省学习代价。同时，使用置信度差异作为度量标准，选取那些最不确定的样本向专家查询，提高了学习效率。在 UCI 数据集上验证了本文算法的有效性。关键词:主动学习;噪声数据:置信度差异;自我训练中图分类号 :TP39 1. 41 文献标识码 :A 文章编号 :2095 - 4824(2013)06 - 0016 - 04 在监督学习中，为获得准确性高的分类模型，需要大量有标注(即分类类型)的样例。现实世界中，通常存在大量未标注样例，而有标注样例则往往较少。例如，在计算机辅助医学图像分析中，可以从医院获得大量的医学图像作为训练集，但如果要求医学专家把这些图像中的病灶都标注出来，往往是不现

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种基于置信度差异代价敏感的主动学习算法.pdfVIP