一种基于置信度差异代价敏感的主动学习算法.pdfVIP

  • 19
  • 0
  • 约6.94千字
  • 约 4页
  • 2017-04-10 发布于北京
  • 举报

一种基于置信度差异代价敏感的主动学习算法.pdf

一种基于置信度差异代价敏感的主动学习算法.pdf

第 33 卷第 6 期 2013 年 11 月 湖北工程学院学报 VOL. 33 NO.6 NOV.2013 JOURNAL OF HUBEI ENGINEERING UNIVERSITY 一种墓于置信度差异代价敏感的主动学习算法 武永成 (荆楚理工学院计算机工程学院,湖北荆门 448000) 摘 要:主动学习时向专家查询得到的标注如果带有噪声,将会影响学习的性能。为减少噪声,人们提出 了基于少数服从多数的多专家主动学习算法,但该算法的缺点是代价往往太高。文章采用了一种自我训练 (self-training) 方法,对某些平均置信度高的样本,直接确定其分类标注,不必向专家查询,以节省学习代价。同 时,使用置信度差异作为度量标准,选取那些最不确定的样本向专家查询,提高了学习效率。在 UCI 数据集上 验证了本文算法的有效性。 关键词:主动学习;噪声数据:置信度差异;自我训练 中图分类号 :TP39 1. 41 文献标识码 :A 文章编号 :2095 - 4824(2013)06 - 0016 - 04 在监督学习中,为获得准确性高的分类模型, 需要大量有标注(即分类类型)的样例。现实世界 中,通常存在大量未标注样例,而有标注样例则往 往较少。例如,在计算机辅助医学图像分析中,可 以从医院获得大量的医学图像作为训练集,但如 果要求医学专家把这些图像中的病灶都标注出 来,往往是不现

文档评论(0)

1亿VIP精品文档

相关文档