基于代表示例选择与svdd的多示例学习算法分析-analysis of multi-sample learning algorithm based on representative sample selection and svdd.docxVIP

  • 3
  • 0
  • 约6.63万字
  • 约 63页
  • 2018-05-18 发布于上海
  • 举报

基于代表示例选择与svdd的多示例学习算法分析-analysis of multi-sample learning algorithm based on representative sample selection and svdd.docx

基于代表示例选择与svdd的多示例学习算法分析-analysis of multi-sample learning algorithm based on representative sample selection and svdd

摘要多示例学习概念是上世纪 90 年代由 Dietterich 等人在研究药物活性预测问题时提 出的。在多示例学习模型中,训练样本的类别标记歧义性不同于传统机器学习模型,使 得多示例学习成为一种全新的机器学习框架。多示例学习具有独特的视角和广泛的应用 前景,且在以往机器学习领域中尚未被深入研究,被认为是与监督学习、无监督学习以 及强化学习并列的第四种学习模型,在国内外机器学习研究中受到了极大关注。随着多示例学习研究的深入,与多示例学习相关的理论体系和算法逐渐发展成熟, 目前主要有两类方法用于解决多示例问题:生成式方法和判别式方法。生成式方法是早 期研究多示例问题常用的方法,其目的是在示例特征空间中确定出感兴趣区域,使得正 示例都位于该区域内,而负示例都远离该区域,它通常用最大似然进行求解。判别式方 法旨在将多示例问题转化为标准监督学习问题,通过改变目标函数的约束条件或采用某 种消除歧义性策略,将多示例学习问题转换为标准的单示例传统机器学习问题。根据这 两种解决多示例学习问题的思路,研究者设计了大量的多示例学习算法,并对其进行了 广泛的应用。现在,多示例学习已被广泛应用于数据挖掘、文本分类、图像检索、股票 市场预测、垃圾邮件过滤等领域。多示例学习算法的研究是多示例学习问题和应用的核心,本文吸收 MILD 与 MILIS 方法的思想,提出了四种基于 SVDD 的自适应多示例学习算法:算法 MILD-NSVDD_I 与算法 MILD-NSVDD_B,以及算法 MILIS-NSVDD_I 与算法 MILIS-NSVDD_B。本文 主要研究了以下三个方面的内容:首先,本文研究与总结了多示例学习与支持向量数据描述的研究现状。简要阐述了 多示例学习问题与支持向量数据描述方法的相关背景,综述了多示例学习相关理论、多 示例学习与传统机器学习的区别、几个多示例学习的经典算法与相关应用、多示例学习 的扩展问题、统计学习理论与支持向量机理论等,研究了硬间隔单分类、软间隔单分类 与带负类二分类三种支持向量数据描述方法等内容。其次,本文深入研究了基于代表示例选择与 SVDD 的多示例学习方法。探讨了正负 包中代表示例选择方法、基于示例级的特征映射与基于包级的特征映射方法,研究并提 出了将代表示例更新与分类器训练交替迭代进行的迭代学习框架,研究了基于 SVDD 的 两 种 典 型 多 示 例 学 习 算 法 mi-NSVDD 与 MI-NSVDD , 提 出 了 基 于 示 例 分 类 的 MILD-NSVDD_I 算 法 与 基 于 包 分 类 的 MILD-NSVDD_B 算 法 、 基 于 示 例 分 类 的 MILIS-NSVDD_I 算法与基于包分类的 MILIS-NSVDD_B 算法。最后,本文在 PC 机上设计了两个数值实验,通过在多示例学习的基准测试数据集MUSK 与基于内容检索的 COREL 图像库上验证本文算法的有效性,对比并分析了本文I提出的算法与其他多示例学习算法在这两个实验中的分类性能,并直观的从物理意义上分析了基于示例级特征映射的分类算法与基于包级特征映射的分类算法之间性能差异 的原因。综上所述,本文提出的算法 MILD-NSVDD_I 与算法 MILD-NSVDD_B、以及算法 MILIS-NSVDD_I 与算法 MILIS-NSVDD_B 在解决多示例学习问题上是可行的,具有一 定的理论与实际应用意义。关键词:机器学习,多示例学习,代表示例选择,支持向量数据描述IIABSTRACTThe term multi-instance learning was proposed by Dietterich et al. in 1990s while studying drug activity prediction problems. In multi-instance learning model, ambiguity of the training is not as the traditional machine learning model, this makes the multiple instance learning a new machine learning framework. Multi-instance learning has a unique perspective and broad application prospect, and has not yet been deeply studied in the field of machine learning. Multi-instance learning is considered to be the fourth learning model

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档