一种基于多示例多标记学习的新标记学习方法-中国科学信息科学.PDFVIP

下载本文档

8
0
约2.02万字
约 11页
2019-05-18 发布于天津
举报
版权申诉

一种基于多示例多标记学习的新标记学习方法-中国科学信息科学.PDF

1、本文档共11页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

中国科学: 信息科学 2018 年第48 卷第12 期: 1670–1680 论文一种基于多示例多标记学习的新标记学习方法朱越姜远周志华计算机软件新技术国家重点实验室南京大学南京软件新技术与产业化协同创新中心南京通信作者收稿日期接受日期网络出版日期国家自然科学基金批准号资助项目摘要多标记学习是一种应用非常广泛的学习范式其中一个对象可能同时与多个标记相关联传统的多标记学习研究多假设训练数据中观察到的标记分布与测试数据的真实标记分布一致但在实际应用中训练数据中可能存在一些从未被标注出的新标记在预测时不仅希望能够在目标标记集合已知标记上取得好的性能还要求能够检测出样本是否存在新标记针对这种多标记新标记学习问题本文提出了一种端到端的多视图多示例多标记学习方法该方法基于卷积神经网络产生多示例包并通过最小化包上观察标记的错分损失和对新标记预测值排序损失的惩罚以及对多视图预测不一致的惩罚同时学习图像文本两个视图的特征表示以及已知标记和新标记的预测函数在大规模图片文本真实数据集上验证了在已知标记学习和新标记检测任务上的有效性关键词多标记新标记学习多示例多标记学习多视图学习深度学习引言多标记学习∼ 是一种非常重要的学习范式其中一个对象可能同时与多个标记相关联传统多标记学习的研究多假设训练数据中观察到的标记分布与测试数据的真实标记分布一致但在实际应用中训练数据中可能存在一些从未被标注出的新标记而对测试数据需要预测这些新标记例如图片标注任务要求标注图片是否有建筑和车辆那么标注者可能只关心建筑和车辆的语义而不会对图片出现的天空、树木等其他语义进行标注如何预测样本中是否有天空、树木这样在训练集中存在相关语义但从未被标注出的新标记呢直接在多标记学习的框架下检测新标记是非常困难的现有一类多标记弱标记学习工作考虑标记部分缺失的情况某些样本上缺失的标记在另一些样本上可以观测到在这种情况下可以利用低秩结构特性通过优化矩阵核范数或者最小化重构误差进行低秩矩阵分解从而对标记矩引用格式朱越姜远周志华一种基于多示例多标记学习的新标记学习方法中国科学信息科学 ⃝ 《中国科学》杂志社中国科学: 信息科学第 48 卷第 12 期阵进行补全但是在多标记新标记学习中由于在整个训练集中新标记对应的语义均未被标注即真实标记矩阵整列缺失无法利用低秩矩阵补全如果直接采用异常检测的方法判断是否有新标记出现也可能失败一个样本可能不仅仅有新标记还可能同时与多个已知标记相关联因而很难从特征上将同时有新标记和已知标记的样本和那些只有相同已知标记的样本区分开即使一个样本被检测算法认为是一个异常样本可能由于该样本真的与新标记相关联也有可能是因为出现了训练集中没有出现过的已知标记的组合因此为了解决多标记新标记学习问题考虑应用表示能力更强的学习范式主要包括结构和特征两个层面从结构上学习框架采用多示例多标记学习框架∼ 其中每个对象由一个多示例包表示包中的每个示例对应某一个语义概念包的标记即为包中样本标记的并集在训练过程中只能观察到包的标记而具体的包中示例的标记不可见以图像标注任务为例一个多示例包对应的是一幅图像而包中的示例则对应图像分割成的各个小块直觉上看在多示例多标记学习框架下只要能够