- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国科学 信息科学 年 第 卷 第 期
SCIENTIA SINICA Informationis
人工智能优青专刊 论文
标记分布学习与标记增强
1,2* 1,2
耿新 徐宁
1. 东南大学计算机科学与工程学院, 南京 211189
2. 计算机网络和信息集成教育部重点实验室 (东南大学), 南京 211189
* 通信作者. E-mail: xgeng@
收稿日期: 2018–02–06; 接受日期: 2018–04–11; 网络出版日期: 2018–05–11
国家重点研发计划项目 (批准号: 2017YFB1002801)、国家自然科学基金优秀青年科学基金项目 (批准号: 、江苏省杰出
青年基金项目 (批准号: B 资助, 并受到软件新技术与产业化协同创新中心和无线通信技术协同创新中心支持
摘要 本文主要介绍了标记分布学习和标记增强的相关概念及算法. 标记分布学习是一种新型机
器学习范式, 传统的单标记和多标记学习都可以看做是该范式的特例. 标记分布学习将不同标记对
示例的重要程度用标记分布来显式刻画, 已经在多个应用领域中取得很好的效果. 然而, 现有的多数
数据集中却仅具有简单的逻辑标记而非完整的标记分布, 因此无法直接应用标记分布学习. 为解决
这一问题, 可以通过挖掘训练集中蕴含的标记重要性信息, 恢复出每个示例的标记分布. 我们将原始
逻辑标记提升为标记分布的过程定义为标记增强. 本文给出了标记分布学习和标记增强的形式化定
义, 介绍了典型标记分布学习和标记增强算法, 并对这些算法进行了分析讨论.
关键词 标记分布, 标记分布学习, 标记增强, 多标记学习, 标记多义性
引言
标记多义性问题是机器学习领域的热门研究方向. 在现有的机器学习范式中, 主要存在两种数据
标注方式: (1) 一个示例分配一个标记; (2) 一个示例分配多个标记. 单标记学习 (single-label learning,
SLL) 假设训练集中所有的示例均用第 1 种方式标注, 而多标记学习 (multi-label learning, MLL) 允
许训练示例用第 2 种方式标注. 因此, 多标记学习可以处理一个示例属于多个类别的多义性情况. 无
论是单标记学习还是多标记学习, 都旨在回答一个本质的问题, 即 “哪些标记可以描述该示例?”. 然
而, 它们都没有直接回答另一个更深一层的问题 “每个标记如何描述该示例?”, 即每个标记对该示例
的相对重要程度如何?
对于真实世界中的许多问题, 不同标记的重要程度往往是不同的, 例如, 一幅自然场景图像 被
标注了 “天空” 、“水” 、“森林” 和 “云” 等多个标记, 而这些标记具体描述该图像的程度却是不同的;
在人脸情感分析 中, 人的面部表情常常是多种基础情感 (如快乐、悲伤、惊讶、愤怒、厌恶和恐惧)
引用格式 耿新 徐宁 标记分布学习与标记增强 中国科学 信息科学
中国科学》杂志社
⃝ 《
Downloaded to IP: 9 On: 2018-09-26 23:25:43 /doi/10.1360/N112018-00029
耿新等 标记分布学习与标记增强
Mostly sky
A little cloud
文档评论(0)