- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多示例学习研究
武岩松*
(南京大学 计算机科学与技术系, 南京 210093)
Multiple-Instance Learning: A Survey
Yan-Song Wu
(Department of Computer Science and Technology, Nanjing University, Nanjing 210093, China)
Abstract:
Multiple-instance learning is a variation on supervised learning. It is categorized as the fourth learning
framework besides supervised learning, unsupervised learning and enforcement learning because of
its unique properties. In multi-instance learning, the training set comprises labeled bags that are
composed of unlabeled instances, and the task is to predict the labels of unseen bags. This paper
provides a survey on this topic. The paper firstly introduces the background of MIL and the history of
MIL learning. Then this paper will introduce four popular MIL-learning algorithms separately which are
Diverse Density, Citation-kNN, BP-MIP and RBF-MIP. Empirical experiences will be done and results will
be analysed. In particular, this paper employs a unified view to look into multi-instance learning
algorithms. In the end of the paper will give some personal view of these algorithms.
Key word: Multiple-instance learning; supervised learning; bag; label
摘要:
多示例学习是监督学习的一种变形,因为其独特的性质,多示例学习被认为是与监督学习、非监督学习和强化学
习并列的第四种学习框架。在多示例学习中,训练集由被标记的包构成,而包是由未被标记的示例构成,多示
例学习的目的是通过对训练集的学习从而预测不可见包的标签。这篇论文是对多示例学习的一个研究,本文先
简要介绍多示例学习的背景和历史成果,之后分别介绍四种多示例学习算法,他们分别是:Diverse Density、
Citation-kNN 、BP-MIP 和RBF-MIP 。通过对数据集进行实验验证,并通过统一的标准对结果进行比较,简要说
明这些算法各自的优点与不足之处。最后提出对多示例学习的一些个人想法以及对未来发展的展望。
关键词:多示例学习;监督学习;包;标签
1 引言
过去的几年中,基于示例的学习(learning from examples)是机器学习领域的一个热点。
所谓基于示例的学习指通过对已有示例的训练和学习得到一个目标概念,通过概念建立模型
用于对未知示例进行预测。根据数据训练集的模糊性,该方向的研究大致分成三种学习框架:
监督学习、非监督学习和强化学习。其中监督学习的训练集由已知标签的数据构成,通过对
训练集的学习构造一个目标概念,从而对未知标签的数据进行分类。非监督学习的训练集由
未知标签的数据构成因为其模型的模糊性最大。强化学习的目的是通过学习得到一个从状态
到动作的映射,训练集中的数据虽然是无标签的,但是每个动作都有一个延迟奖励(delayed
rewards),可被认为是延迟获得的标签,因而强化学习的模糊性介于监督学习和非监督学习
之间。多示例学习是由Dietterich 等人[1]在关于分子活性预测问题的研究时首次提出的。
1.1 分子活性预测
文档评论(0)