多标记分类方法比较-LAMDA-南京大学.PDFVIP

  • 57
  • 0
  • 约2.22万字
  • 约 8页
  • 2018-03-14 发布于天津
  • 举报
多标记分类方法比较-LAMDA-南京大学

多标记分类方法比较 徐兆桂 (南京大学 计算机科学与技术系, 南京 210093) A Comparative Study of Multi-label Classification Approaches Zhao-GUI Xu (Department of Computer Science and Technology, Nanjing University, Nanjing 210093, China) Abstract : Multi-label learning is a common problem in real application, and till now many approaches have been proposed to solve it. Generally, these approaches can be divided into two kinds, problem transformation methods and algorithm adaptation methods. In this paper, a structural overview has been given based on these two kinds of approaches, and some of which have been chosen to make empirical comparisons as well. In the experiment part of this paper, approaches are separated into two groups, BR, CC and RAkEL a group, and MLkNN, BRkNN and BPMLL a group. Different real-world datasets and various evaluation measures are used to explore advantages and disadvantages of each approach. Key words: multi-label; problem transformation; algorithm adaptation; BR; CC; RAkEL; MLkNN; BRkNN; BPMLL 摘 要: 多标记学习是现实运用中的一类常见的问题,目前已经有很多种方法来解决多标记分类问题。这些方 法大致可以分为两类分别是问题转换和算法改造。本文针对这两类方法作了结构性的介绍并且对其中的一些方法 作实际比较。在文章的实验部分中,这些方法被分成两组进行比较,BR、CC 和RAkEL 为一组,MLkNN、BRkNN 和BPMLL 为一组。实验利用不同的数据集和不同的评价指标来探索这些方法的优缺点。 关键词: 多标记学习;问题转换;算法改造;BR ;CC ;RAkEL ;MLkNN ;BRkNN ;BPMLL 1 引言 传统的分类学习中,每个样本只属于一个类别。然而在很多实际问题当中,一个样本可能同时属于多个 [1] [2] 类别。例如,在文档分类 问题中,每篇文档可能属于多个预定义的主题,在图片分类 中,每个图片可能 [3] 含有不同的语义,在生物信息学 问题中,每个基因可能同时具有多种功能。由此引出了多标记学习 (Multi-label learning )的研究。至今,研究者们已经提出了多种多标记学习的方法,比如基于支持向量的方 法,基于 BP 神经网络的方法,基于概率生成模型的方法等。这些算法在文档分类、生物信息学以及场景分 类等许多领域得到了成功的运用。 本文首先选择两种基于K 近邻的惰性学习方法进行比较,并选择其中相对较好的与基于BP 神经网络的 2 方法BPMLL ,以及基于转换的学习方法LP 相比较,最后给出了一些比较之后的总结。 2 多标记分类简介

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档